23-6-2016 Gedruckt am 30-05-2017 aus www.monitor.co.at/index.cfm/storyid/16874

Big Brother liest & lernt mit

Datenkrake Facebook

Erst kürzlich stellte Facebook DeepText vor. Nach eigenen Angaben soll das Tool binnen weniger Sekunden die Inhalte mehrerer Tausend Facebook-Seiten erkennen und daraus auch Rückschlüsse ziehen können. Der nächste Schritt zur totalen Überwachung.

Bild: Facebook

"Es regnet! Ich brauche ein Taxi!". Harmlose Sätze wie dieser, via Facebooks Messenger geteilt, könnten in Zukunft konkrete Auswirkungen haben. In diesem Fall wär’s ja noch was recht praktisches, wenn dann ein plötzlich ein Taxi auftaucht – herbeigerufen von Facebook. Denn mit DeepTexxt liest das Social Network mit und versteht das Gelesene immer besser - und das in mehr als 20 Sprachen.
 
Sascha Pfeiffer, Sicherheitsberater der Firma Sophos, warnt: „Verbraucher sollten sich immer darüber im Klaren seien, dass sie von großen Internetunternehmen als Kunde gesehen werden, nicht als Nutzer. Das gilt auch, wenn der eigentliche Dienst, wie etwa bei Facebook, kostenfrei ist. Von einem Kunden wird Umsatz in Form von Käufen erwartet, ein Nutzer zahlt mit seinen Daten. Hier ist grundsätzlich Vorsicht geboten, denn in Situationen, wie diesen, kann keine Firewall oder Antiviren-Software das Abfließen der persönlichen Informationen verhindern.“

Der Kontext macht den Unterschied

Zum Verstehen der Texte wird sogenanntes Deep Learning verwendet. Damit eine Maschine Text verstehen kann, muss immens viel erklärt werden. Es gibt die allgemeine Klassifikation, wie etwa die Tatsache, dass es sich um einen Post beispielsweise zum Thema Fußball handelt. Zusätzlich muss aber auch das Verständnis für sinnvolle Kontextinformationen, wie Spielernamen oder Statistiken eines Spiels, vorhanden sein.
 
Um überhaupt in die Nähe eines menschlichen Textverständnisses zu gelangen, müssen darüber hinaus auch Slang und Begrifflichkeiten verstanden werden. So kann es sich bei Apple oder Blackberry um Obst oder technische Geräte handeln – der Kontext macht den Unterschied. Zudem muss die Technik skalierbar sein: Wie TechCrunch kürzlich berichtet, werden auf Facebook pro Minute rund 400.000 neue Stories und 125.000 Kommentare zu öffentlichen Beiträgen veröffentlicht. Das ist bereits jetzt immens viel und wird in absehbarer Zeit kaum weniger werden.
 
DeepText, das Tool, das all diese kleinen Textteilchen zu etwas Verständlichem zusammenfügen soll, basiert eben auf diesem Deep Learning. Dabei handelt es sich um einen Zweig des maschinellen Lernens basierend auf einer Reihe von Algorithmen, die durch die Verwendung mehrerer Verarbeitungsschichten Abstraktionen in Daten modellieren, entweder mit komplexen Strukturen oder zusammengesetzt aus nichtlinearen Transformationen.
 
Ein Beispiel für die Verwendung von Deep Learning: In der traditionellen Verarbeitung natürlicher Sprache werden Wörter in ein Format umgewandelt, das einen Computer-Algorithmus erlernen kann. Das Wort "Bruder" könnte also einer ID wie 4598 zugewiesen werden, während das Wort "Bro" die 986665 erhält. Aber das funktioniert nur, wenn jedes Wort genau richtig geschrieben ist. Deep Learning nutzt stattdessen "Wort Einbettungen", ein mathematisches Konzept, das die semantische Beziehung zwischen Wörtern bewahrt. Das ermöglicht einem Computer zu erkennen, dass "Bruder" und "Bro" eigentlich nahe beieinander liegen, und es ermöglicht die Erfassung der tieferen semantischen Bedeutung.

Man will uns ja nur helfen...

Facebook verwendet bereits jetzt DeepText Modelle, um Menschen Tools anzubieten, die sie vielleicht brauchen könnten. Möchte jemand beispielsweise ein Fahrrad für 200 Euro verkaufen erkennt DeepText zuerst einmal, dass etwas verkauft werden soll. Es erkennt außerdem das angebotene Produkt, die Art des Verkaufs und den Preis. Zu diesem Zweck könnte es dann besondere Tools anbieten, die solche Transaktionen erleichtern.
 
Neben dem besseren Verständnis der Posts können Absichten und Stimmungen besser entschlüsselt werden. Das gilt auch für gemischte Inhalte, die aus Bild und Text bestehen. Auf diese Weise könnte qualitativ hochwertiger Inhalt gefördert und unerwünschter Inhalt, wie etwa Hass-Kommentare, gelöscht werden.
 
All jenen, denen diese allzu menschliche Fähigkeit von Facebook ein wenig gruselig vorkommt, empfiehlt Sascha Pfeiffer, beim Teilen vorsichtig zu sein: „Auch wenn Sie denken, dass Sie nur mit Freunden reden: Facebook hört mit und versteht von Tag zu Tag besser, was wir sagen.“