Menü

Big Data – welche Daten gebe ich preis?

Ein Tool, das eigentlich ein Sicherheitsschutz für das Surfen sein soll (Web of Trust, WOT), ist in Wirklichkeit eine Beobachtungssoftware. Die Software zeichnet im Hintergrund das Surf-Verhalten des Nutzers auf und sendet diese Daten an einen Server im Ausland. Dort wird ein Profil erstellt, bei dem Datum, Uhrzeit, Ort und angesteuerte Web-Adresse gemeinsam mit einer Nutzer-Kennung abgespeichert werden. Diese Daten gehen dann an Zwischenhändler, die diese Daten auf dem Datenmarkt zum Verkauf anbieten.

Text: Wolfgang Semar / Bild: iStockphoto

Die Web-Verläufe geben alle Geheimnisse aus dem Berufs- und Privatleben preis, damit wird unsere Privatsphäre in keinster Weise mehr respektiert. Experten haben sich diese Datensätze angesehen und konnten viele Nutzerinnen und Nutzer eindeutig identifizieren. Zum Beispiel über E-Mail-Adressen in denen der Name steht, oder Anmeldenamen und andere Bestandteile aufgerufener URLs. Darin sind auch Namen, Anschriften, Telefonnummern und E-Mail-Adressen von Bekannten und Verwandten enthalten. Kriminelle könnten somit Personen mit den Details zu ihrem Surf-Verhalten erpressen. Die Big Data Expertinnen und Expertehn der HTW Chur sind sehr überrascht darüber, wie einfach man einen Grossteil der auf dem Markt zu kaufenden Daten deanonymisieren kann.

Was wird noch alles über uns gespeichert?
Auch ohne den Einsatz von WOT hinterlässt jeder Nutzer beim Surfen eine Datenspur. Jeder Seitenaufruf generiert einen Dialog zwischen dem Browser als Client und dem Server, der die Daten ausliefert. Wer sich im Internet bewegt hinterlässt Spuren in Form von Daten. Das Auslesen der IP-Adresse des Computers, des Betriebssystem, des genutzten Browser, der vorhandenen Schrifttypen und der installierten Add-Ons führt zu einer Art Browser-Fingerabdruck (Device Fingerprinting), der in der Kombination einmalig ist und so eine eindeutige Identifizierung und Verfolgung zulässt, selbst wenn der Browser keine Cookies akzeptieren sollte. Wer mal ausprobieren möchte wie einzigartig sein System ist, kann bei Panopticlick.eff.org eine Test durchführen.

Wer in sozialen Netzwerken, Foren usw. aktiv ist, gibt ausserdem freiwillig jede Menge privater Daten preis, über Suchanfragen werden Interessen oder Kaufabsichten deutlich. Die Aktivitäten im Netz ziehen eine regelrechte Datenflut nach sich. Sogar die sogenannte MAC-Adresse des eigenen Router wie von Apple, Google und anderer wird zur «Verbesserung» deren Lokalisierungsdatenbank abgegriffen. Wer wissen will was Facebook so alles über einen gespeichert hat kann seine Daten offiziell bei Facebook anfordern und wird sicherlich überrascht sein wie gross diese Datenmenge ist. Zu diesem Thema gibt es ein sehr gut gemachtes taz.de-Video auf YouTube.

Daten sammeln lohnt sich!
Viele Internetdienste und -händler sammeln Daten. Den Firmen kommt es weniger auf den einzelnen Nutzer an als vielmehr auf das Verhalten der Masse. Um das nachweisen zu können werden aber die einzelnen Nutzerdaten genau betrachtet. Diese Daten werden verknüpft und mit vorhandenen Datenbanken abgeglichen, um herauszufinden, was die Nutzer kaufen möchten. Daten sind die elementaren Treiber der neuen, digitalen Geschäftsmodelle und bilden einen entscheidenden Wettbewerbsvorteil.

Wie kann man seine Daten schützen?
Spurlos im Netz surfen geht heutzutage nicht mehr aber wir können möglichst wenig dem Netz von uns verraten. Es gibt bestimmte Einstellungen die man vornehmen sollte um etwas sicherer zu surfen. Z. B den Einsatz von Cookies einzuschränken oder den Trackingschutz zu aktivieren. Wer auf mehr Anonymität setzen will sollte folgendes beachten: Keinen seltenen Browser benutzen, JavaScript deaktivieren, Anonymisierungsdienste benutzen und nur im Privatmodus surfen.

Wo gehen meine Daten hin?
Wer von einer Website wissen will wo diese überall seine Daten hinschickt, dem sei die Website von einer bestimmten Website http://datenblumen.wired.de
empfohlen. Man gibt eine beliebige URL in das Suchfenster ein und klickt auf den Button «Datenblume erstellen». Wenn die Analyse abgeschlossen ist sieht man die «Datenblume» für die gewählte Website. So lässt sich herausfinden, wer alles Daten über seinen Besuch auf dieser Website erhält. Die Abbildung zeigt die Datenblume für diesen Blog der suedostschweiz.ch

datenblume
Datenblume der Website

Wie sollte eine solche Blume am besten aussehen?
Die Kreise in der Datenblume stehen für Dateien, aus denen eine Website besteht – Bilder, Programmcode, Layout-Regeln, Hypertext. Jede Farbe steht für einen anderen Datentyp, je grösser ein Kreis, desto grösser die Datei. Je kleiner die Blume, desto besser das Ergebnis. Alle Dateien, die im Haupt-URL-Kreis liegen, werden an den Server der Website selbst gesendet. Anders sieht das bei den Kreisen aus, die ausserhalb der Haupt-URL liegen. Hierbei handelt es sich um Webseiten die unserer Daten erhalten und von denen wir eigentlich nicht wissen, dass sie unserer Daten bekommen. Die Webseiten gehören zu Drittanbietern, die Daten über uns sammeln und so Profile anlegen können.


WOLFGANG SEMAR
Wolfgang Semar ist der Leiter des konsekutiven Master of Science in Business Administration mit der Vertiefung Information and Data Management. Diese Studienrichtung beschäftigt sich mit dem Sammeln, Analysieren, Auswerten und Visualisieren von grossen Datenmengen für alle Geschäftsbereiche in Unternehmen. Dabei werden aber nicht nur klassische Daten sondern auch digitale Texte wie sie auf Webseiten vorkommen analysiert und ausgewertet.

Dies ist ein Blog-Beitrag der HTW Chur.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.