Datenvisualisierung vs. Vorratsdatenspeicherung

Ich habe die re:log Visualisierung von re:publica Bewegungsdaten vor einigen Tagen hier im Blog sehr positiv besprochen: Aus der Bewegung der Menschenströme lassen sich viele spannende Erkenntnisse ableiten, zum Beispiel über die Qualität von Vorträgen.

Nun wurde die Visualisierung nicht überall so positiv aufgenommen: In vielen Kommentaren werden Parallelen zur „Vorratsdatenspeicherung“ gezogen, andere beklagen den Mangel an einer transparenten Kommunikation mit den re:publica Besuchern, die von der Datenspeicherung nichts wussten. (Die Kommentierenden im Blog der Konferenzausrichtenden sind insgesamt eher wenig begeistert.)

Betrachten wir zuerst den einfacheren Fall, die Nicht-Informierung der Teilnehmenden. Losgelöst davon, dass die Daten, die hier anonymisiert zur Visualisierung genutzt wurden, in jedem WLAN abgegriffen werden können, ist das Vorgehen, sowas ohne das Wissen der Teilnehmenden zu machen, keineswegs wünschenswert. Insbesondere wegen der Ausrichtenden waren die Teilnehmenden wahrscheinlich nicht davon ausgegangen, dass eine solche Datenerhebung stattfinden würde. Im Sinne eines fairen Umgangs miteinander wäre hier eine klare Kommunikationsstrategie, die deutlich macht, welche Daten ausgewertet werden, wünschenswert: Die Visualisierung ist spannend und wegen der Anonymisierung (die wie fast jede andere Anonymisierung nicht 100%ig funktioniert) wie ich finde auch keineswegs zu invasiv, trotzdem bekommt sie durch die Intransparenz einen faden Beigeschmack. Kritik in dieser Richtung halte ich also für durchaus angebracht, insbesondere an Netzpolitik.org als Bürgerrechtsaktivisten werden hier einfach höhere Anforderungen gestellt als an irgendwelche anderen Ausrichter.

Kommen wir nun zum spannenderen Teil: Dem Vergleich zur Vorratsdatenspeicherung. Unter Vorratsdatenspeicherung verstehen wir in diesem Kontext insbesondere die anlasslose Speicherung von Verbindungsdaten von Menschen. Die Exekutive will diese Verbindungslisten haben, um im Falle von Verbrechen u.ä., die Verbindungen einer Person oder die Person, die zu einer Verbindung gehört, abfragen zu können. Egal wie man zur Vorratsdatenspeicherung steht, es wird hier sehr schnell klar, dass der Vergleich der re:log Visualisierung oder der genutzen Daten inhaltlich kompletter Unfug ist.

Die re:log Daten sind nicht personenbezogen, aus dem Datensatz selbst gehen keinerlei Personenzuordnungen hervor. Das hat einerseits natürlich mit der Anonymisierung zu tun, die alle Datenpunkte auf reine Zahlen herunterbricht. Andererseits kommt hinzu, dass die zur Identifikation verwendeten MAC Adressen, per Definition Geräteadressen sind: Wenn man z.B. wie ich seinen Laptop anderen Menschen zur Verfügung stellt, dann würden die Bewegungsprofile von zwei Menschen an einer Stelle zusammengeführt. Hier fehlt also schonmal ein ganz signifikanter Bezug zu dem, was die Vorratsdatenspeicherung ausmacht: Der Personenbezug.

Doch auch den anderen signifikanten Aspekt der Vorratsdatenspeicherung kann der re:log Datensatz nicht erfüllen: Die Sammlung von Verbindungsdaten. Natürlich wird hier irgendwie gemessen, welche Geräte mit dem Netzwerk „verbunden“ waren, doch das ist ja nicht, was wir unter Verbindungsdaten verstehen. Eine Verbindung im Sinne der Vorratsdatenspeicherung ist eine 1:n Verbindung, die über das Netzwerk hergestellt wird. In diesem Falle hätten die Netzwerkbetreiber an dieser Stelle buchführen müssen, welche Webseiten welche Nutzenden angesurft haben oder zu welchen Servern sie andere Verbindungen aufgenommen haben. Diese Daten sind aber nicht ansatzweise im re:log Datensatz vorhanden.

Wir können also zusammenfassen: Das re:log Projekt bzw. die Datensammlung hätte im Vorfeld kommuniziert werden sollen, die Verbindung zur Vorratsdatenspeicherung und die damit einhergehende Empörungswelle hingegen ist Humbug.

Die Reaktionen auf dieses Experiment hingegen werfen einige neue Fragen auf.

Beschweren sich die Kommentatoren auf über das kostenlose WLAN Netz in den Starbucks Filialen, welches von der BT Group (British Telecom) betrieben wird? Wie ist das mit dem WLAN auf der CeBIT, welches T-Systems bereitstellt? Fragt dort irgendjemand nach, welche „Abfalldaten“ dort erhoben und wie sie verwendet werden?

Wie ist das eigentlich mit Freifunk? Erheben dort einzelne (oder mehrere Knoten) solche Daten? Kann das ausgeschlossen werden? Was ist mit all den Event-WLANs?

Das OpenDataCity Team hat für ihr re:log Projekt einen recht konservativen Kompromiss zwischen einer spannenden Datennutzung und der Anonymisierung von Menschen gewählt. Die ihnen teilweise entgegenschlagende Kritikwelle deutet auf ein grundsätzliches Unverständnis der Struktur der Realität hin: Egal ob wir uns in der physischen Welt oder der digitalen Bewegen, wir hinterlassen Spuren. Wir reagieren zu recht ungehalten darauf, wenn uns jemand verfolgt und beschattet, doch was OpenDataCity hier gemacht hat, ist eher vergleichbar damit, in einer Bar aufzustehen und sich umzusehen – ein Verhalten, welches in der physischen Welt niemand kritisieren würde.

Advertisements

Über tante

Chimpanzee that!
Dieser Beitrag wurde unter Uncategorized abgelegt und mit , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

3 Antworten zu Datenvisualisierung vs. Vorratsdatenspeicherung

  1. H. Schwarzenroth schreibt:

    Zum Thema Vorratsdatenspeicherung: Unter „im Falle von Verbrechen u.ä.“ subsumierst du dann auch den schrankenlosen Zugriff der Geheimdienste für deren Zwecke. Das sind dann vermutlich „Gedankenverbrechen“ oder so …

  2. Pauline schreibt:

    Die Daten wurden laut Veranstalter nicht anonymisiert, sondern pseudonymisiert.
    siehe hier http://apps.opendatacity.de/relog/
    Für pseudonymisierte Daten gilt (meiner Meinung nach) die Datenschutzgesetzgebung.
    In dem Sinne ist das Vorgehen zu überdenken sowie auch der Artikel, da dieser sich auf die Anonymisierung der erhobenen Daten beruft.

    Ob ein Hinweis auf Starbucks Filialen oder ähnliches ein qualitatives Merkmal sind kann ich nicht beurteilen. Bei mir vermittelt es den Eindruck, dass man einfach durch andere Probleme vom eigentlichen Fokus ablenken will.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s