Die Keynote ist vorbei – Zeit, um ein bisschen durchzuatmen und das gestern Gesehene ein wenig zu verdauen. Dementsprechend möchte ich heute noch nicht auf die Neuvorstellungen eingehen, sondern stattdessen auf ein oft zitiertes, und selten erklärtes, Apple Konzept eingehen. Mit Differential Privacy versucht Apple, möglichst viele wichtige Daten zu verarbeiten und die Privatsphäre der Nutzer dabei dennoch zu schützen.
Privatsphäre gegen Crowd-Sourcing, Datenschutz gegen Always-On-Society. Viele Wünsche, die Nutzer an die moderne Technik stellen, scheinen sich auf den ersten Blick zu widersprechen. Während der Kunde möglichst viel von den Daten aller Nutzer lernen, und auf intelligente KIs zurückgreifen möchte, sollen die eigenen Daten ja bei einem selbst bleiben. So möchten wir zwar von allen lernen, aber selbst unsere Daten nicht abgeben – ein Problem, dem sich die großen Tech-Konzerne auf sehr unterschiedlichen Ebenen nähern.
Apple hängt den Datenschutz der Kunden besonders hoch und betont immer wieder, dass der Kunde nicht das Produkt sei. Bei Google sei dies anders, so sagt auch Apple dies mittlerweile selbst ohne vorgehaltene Hand.
Privacy und (Schwarm)-Intelligenz
Tatsächlich fährt Google hier einen sehr offenen Ansatz. Der Konzern nimmt alle Daten die er kriegen kann – und mehr. Erst kürzlich gab es einen Skandal über Daten, die extern zugekauft werden, wie beispielsweise die von Mastercard. Auf Basis dieser enormen Ansammlung von Daten lernen die Google Services dazu und die eigene KI erhält Material zum Lernen. Auch wenn dieser Ansatz aus Sicht der Privatsphäre zu verurteilen ist – auf der anderen Seite gibt es nennenswerte Vorteile. Der Google Assistant schneidet in unabhängigen Vergleichstests häufig sehr gut ab, Google Fotos erkennt viele Bilder bzw. deren Inhalte und Google Maps bietet Verkehrsinformationen, die weit über die Qualität der Konkurrenz hinausgehen.
Apple hingegen greift auf weniger Daten der Nutzer zurück. Lange wurden auch die meisten Aufgaben nur lokal auf der Hardware durchgeführt. So bot Apple zwar auch Bilderkennung, diese aber immer nur auf dem lokalen Gerät. Das brachte zwei Nachteile: Einerseits müssen die Fotos auf jedem Gerät verarbeitet werden, andererseits kann sich die Schwarmintelligenz so deutlich schwerer weiterentwickeln.
Differential Privacy – lernen ohne identifizieren
So unrecht es Apple auch sein mag – der Konzern muss auch auf die Daten der Nutzer zurückgreifen, um sich weiterzuentwickeln. Zudem bietet die Cloud häufig Vorteile für die Nutzer. Das erkennt der Konzern mittlerweile auch an – so werden die Daten der Fotos inzwischen doch über die iCloud geteilt. Um die Daten der Kunden dennoch möglichst gut zu schützen, greift Apple hier auf den Ansatz Differential Privacy zurück.
Bei Wikipedia wird dieses Verfahren wie folgt beschrieben:
Differential Privacy (engl. für ‚differentielle Privatsphäre‘) hat das Ziel, die Genauigkeit von Antworten zu Anfragen an Datenbanken zu maximieren, unter Minimierung der Wahrscheinlichkeit, die zur Beantwortung verwendeten Datensätze identifizieren zu können. Der Begriff fällt in den Bereich des sicheren, Privatsphären erhaltenden Veröffentlichens von sensiblen Informationen. Mechanismen, die Differential Privacy erfüllen, verhindern, dass Angreifer unterscheiden können, ob eine bestimmte Person in einer Datenbank enthalten ist oder nicht.
Wenden wir diese komplexe Definition auf ein reales Beispiel an: Apple wertet eure Navigationsdaten aus. Der Konzern übermittelt eure Daten nur einmal täglich an die Server, diese werden anonymisiert. Um sie schwerer zuordenbar zu machen, werden auch die ersten sowie die letzten paar Minuten der Navigation nicht übertragen. So soll die Identifikation der genauen Heimatadresse oder beispielsweise des Arbeitsortes erschwert werden. Zudem mischt Apple willkürlich auch zufällige Datensätze unter. In der großen Masse verschwinden diese, beim Blick auf einzelne Datensätze ist die Echtheit des Ursprungs aber nicht zu prüfen.
Welche Daten übermittelt werden, könnt ihr als Kunde direkt einsehen. Unter iOS reicht der Ausflug in die Settings. Über den Weg Datenschutz/Analyse/Analysedaten könnt ihr näheren Einblick nehmen. Unter macOS müsst ihr einen Ausflug ins Terminal unternehmen.
Apple selbst nimmt dieses Thema sehr wichtig, informiert Kunden in diesem eigenen Supportdokument dazu und gibt auch nähere Einblicke im eigenen Machine Learning Journal.
Ihr könnt uns auf iTunes bewerten - damit erhöht sich die Sichtbarkeit dieses Podcasts!
Zugehörige oder ähnliche Episoden: