Was sind eigentlich… Metadaten?

Immer mehr Messenger und Kommunikationsdienste werben damit, dass Ihre Gespräche und Dokumente dort von Anfang bis Ende verschlüsselt werden.

Trotzdem: Auch verschlüsselte Kommunikation sollten Sie nur über einen Anbieter laufen lassen, dem Sie vertrauen. Auch, wenn die Inhalte Ihrer Kommunikation für den Anbieter nicht lesbar sind – die sogenannten Metadaten sind es doch.

Was sind diese Metadaten?

Metadaten sind „Daten über Daten“

Sie dienen dazu, sogenannte Nutzdaten, also beispielsweise den Text einer E-Mail, ein Bild auf ihrer Digitalkamera oder ein E-Book, näher zu beschreiben. Metadaten können neben zusätzlicher Beschreibung der Nutzdaten aber auch Steuerinformationen beinhalten. Der sogenannte Header einer E-Mail beinhaltet beispielsweise sowohl Informationen, die den Inhalt näher beschreiben (z.B. Absender, Betreff und Zeitstempel) als auch solche, die für die Übermittlung der Nachricht wichtig sind (z.B. E-Mail-Adresse des Empfängers).

Auch in der analogen Kommunikation existieren Metadaten. Empfänger und Absender eines Briefes und sogar die Briefmarke sind Steuerinformationen – also auch Metadaten – für den Postdienst. Sie sorgen dafür, dass der Brief beim Empfänger ankommt.

Keine Kommunikation ohne Metadaten

Das Problem mit Metadaten: sie sind unerlässlich, damit Kommunikation überhaupt stattfinden kann und fallen daher auch bei jeglicher Art von Kommunikation an. Gleichzeitig können sie aber in vielen Fällen nicht verschlüsselt werden, da sie auf dem Weg weitestgehend lesbar bleiben müssen. Ein Postbote könnte beispielsweise einen Brief, dessen Adressat und Absender nur verschlüsselt auf dem Umschlag stehen, nicht zustellen.

Metadaten Ihrer E-Mails sind unter anderem Absender, Empfänger, Datum, Uhrzeit und der Betreff.  Auch Telefonanrufe erzeugen Metadaten. Diese sind beispielsweise die Rufnummer des Anrufers, die gewählte Rufnummer sowie Dauer und Uhrzeit des Telefonats.

Sie können sich vorstellen, dass allein schon durch die Auswertung der Metadaten ihres E-Mail-Verkehrs und ihrer Telefonaten ein ziemlich genaues Bild der Gewohnheiten und der sozialen Kontakte einer Person entstehen kann. Mail-Adressen und Telefonnummern, die oft kontaktiert werden, sind wahrscheinlich Freunde und Familie. Eine Telefonnummer, die oft nach zehn Uhr abends angerufen wird, ist wahrscheinlich der Partner oder die Partnerin. Wenn häufig die Nummer eines Arztes oder Krankenhauses angerufen wird, liegt wohl ein gesundheitliches Problem vor, und wenn über mehrere Tage oder Wochen hinweg die Nummer einer psychologischen Beratungsstelle oder eines Psychiaters angerufen wird, dann würden Sie als Arbeitgeber diese Person lieber nicht einstellen, oder?

Was lässt sich aus Metadaten alles ablesen?

Forscher der US-amerikanischen Universität Stanford, Jonathan Mayer und Patrick Mutchler, haben eine Studie zu Metadaten durchgeführt. Das Ziel war, genauer zu beleuchten, welche Arten von sensiblen Informationen man über Personen herausfinden kann, wenn man nur Zugriff auf Metadaten, nicht auf die Inhalte der Kommunikation hat. Zu diesem Zweck boten sie die App MetaPhone kostenlos zum Download an. Freiwillige, die diese App herunterluden, stellten ihre Metadaten über mehrere Monate zur Auswertung zur Verfügung. Die Forscher verzichteten darauf, zusätzlich Daten über die Aufenthaltsorte der Teilnehmer auszuwerten, was technisch aber möglich gewesen wäre.

Die Auswertung zeigte, dass ein großer Teil der Teilnehmer während der Laufzeit der Studie Empfänger kontaktierte, bei denen möglicherweise schon der Anruf an sich eine sensible Information darstellt: Ärzte und Krankenhäuser, Banken und Kreditinstitute, Apotheken, Rechtsanwälte, Personalvermittler und kirchliche Einrichtungen bzw. Einrichtungen anderer Religionen. 7% der Teilnehmer kontaktierten zudem Waffenhändler oder -werkstätten (eine US-amerikanische Eigentümlichkeit, die bei einer deutschen Studie wohl nicht vorgekommen wäre), und 2% der Teilnehmer kontaktierten „Adult Establishments“, worunter vermutlich Bordelle und Nachtclubs zu verstehen sind. Die Anrufe bei medizinischen Einrichtungen konnten die Forscher weiter nach Fachrichtung aufschlüsseln. Beispielsweise gingen immerhin jeweils 1% der Anrufe an suchtmedizinische Zentren und 1% an schönheitschirurgische Praxen oder Kliniken. Eine weitere Aufschlüsselung der anderen Kategorien zeigte zum Beispiel Anrufe bei den Anonymen Alkoholikern, Scheidungsanwälten und Behandlungszentren für Geschlechtskrankheiten.

Der transparente Nutzer: Von Herzrhythmusstörungen und Drogenanbau

Im nächsten Schritt betrachteten die Forscher nicht mehr nur einzelne Anrufe, sondern setzten die Anrufe miteinander in Beziehung, um aus dem Muster weitere Schlüsse zu ziehen. Hier wurden zum Beispiel bei einem Teilnehmer lange Telefonate mit Kardiologen an einem großen Krankenhaus aufgezeichnet, ein kurzes Gespräch mit einem Labor, eingehende Anrufe einer Apotheke und mehrere kurze Anrufe bei der Hotline eines medizintechnischen Geräts zur Überwachung von Herzrhythmusstörungen.

Ein anderer Teilnehmer kontaktierte innerhalb von drei Wochen einen Baumarkt, mehrere Schlüsseldienste, einen Händler für hydroponische Bewässerungssysteme und einen Headshop (ein Geschäft, das Zubehör für den Konsum von Cannabis verkauft). Die Metadaten des ersten Teilnehmers wären sicher hochinteressant für einen potenziellen Arbeitgeber oder eine Versicherungsgesellschaft, bei der der Teilnehmer versucht, eine Lebensversicherung abzuschließen. Für die Metadaten des zweiten Teilnehmers dürfte sich sogar die Polizei interessieren.

Metadaten liefern Aufenthaltsprofile

All dies wurde, wie gesagt, aus Metadaten geschlossen, bei denen die Daten zum Aufenthaltsort des Teilnehmers ausdrücklich nicht berücksichtigt wurden. Noch sensibler wird die Datenlage also, wenn wir geographische Informationen dazuliefern. Zwei Politiker, der Grünen-Abgeordnete Malte Spitz 2009 und der Schweizer Nationalrat Balthasar Glättli 2014 haben der Öffentlichkeit die bei der jeweiligen Telefongesellschaft gespeicherten Vorratsdaten zur Verfügung gestellt. Journalisten der ZEIT beziehungsweise Mitarbeiter der Agentur Open Data City erstellten daraus detaillierte Profile, die zeigen, wo sich die Politiker an welchem Tag zu welcher Uhrzeit aufgehalten haben, mit wem sie wann und wie lange kommunizierten, wie lange sie mit dem Internet verbunden waren und so weiter.

Der Anwalt Ton Siedsma, der für die Bürgerrechtsorganisation Bits of Freedom arbeitet, hat seine Metadaten zwar nur für eine Woche veröffentlicht, aber in noch größerem Detail als es die Vorratsdatenspeicherung der Telefongesellschaft hergeben würde. Die Auswertung zeigte, dass nur aus den Metadaten sein ungefähres Alter, sein Beruf, sein Beziehungsstatus und die Identität seiner Freundin ermittelt werden konnten. Den Weg, den er beim Pendeln zurücklegte, wurde offengelegt, und es konnten Schlussfolgerungen über seine Arbeitsbedingungen, über sensible Inhalte seiner Arbeit sowie über den Studienfortschritt seiner Schwester gezogen werden, über seine Hobbies und Interessen, seine Sympathien für eine bestimmte politische Partei und seine Religionszugehörigkeit. Außerdem konnten detaillierte Netzwerkdiagramme über seine privaten und beruflichen Kontakte erstellt werden. Man kann sich leicht vorstellen, dass diese Analyse noch viel aufschlussreicher werden könnte, wenn wiederum auch die Metadaten dieser Kontaktpersonen analysiert werden würden.

Die am NSA-Untersuchungsausschuss beteiligte Politikwissenschaftlerin Anne Roth berichtete der englischen Zeitung The Guardian, wie ihr Mann, ein Soziologe, im Jahr 2007 unter Terrorverdacht verhaftet wurde. Grundlage des Verdachts waren ihrer Auffassung nach Schlüsselwörter, die er in wissenschaftlichen Aufsätzen verwendet hatte, wie zum Beispiel marxistisch-leninistisch, sowie Metadaten wie die Personen, die er anrief, die Tatsache, dass er seine E-Mails verschlüsselte, und dass er gelegentlich ohne eingeschaltetes Handy aus dem Haus ging.

Metadaten-Sparsamkeit?

Sie fragen sich jetzt wahrscheinlich, wie Sie diese Metadaten-Lecks stopfen können. Um gar keine Metadaten mehr zu hinterlassen, müssten Sie die Funktionalität Ihres Smartphones wahrscheinlich so weit einschränken, dass Sie genauso gut wieder eine Telefonzelle benutzen könnten. Die Erzeugung von Metadaten lässt sich leider nicht vollständig vermeiden – es sei denn, Sie sind bereit, einen hohen Aufwand zu treiben und dabei viele soziale Kontakte aufzugeben. Realistischer ist es daher, sich der Existenz dieser Daten bewusst zu sein und zu versuchen, möglichst wenige (statt keine) solcher digitalen Spuren zu hinterlassen. Sie sollten dazu folgende Punkte beachten:

  • E-Mail-Betreffzeilen bleiben auch bei verschlüsselten Mails klar lesbar. Geben Sie daher keine sensiblen Informationen (zum Beispiel Kundennummern) im Betreff einer E-Mail preis.
  • Schalten Sie in Ihrem Google-Konto die Aufzeichnung von Suchverläufen und Aufenthaltsorten aus.
  • Verzichten Sie auch bei Twitter, Facebook oder anderen sozialen Netzwerken darauf, Ihren Aufenthaltsort bekanntzugeben.
  • Geben Sie in Web-Formularen nur Pflicht-Informationen an.

Aber es bleibt dabei: Ihr Kommunikationsanbieter wird auf jeden Fall Metadaten von Ihnen erheben (müssen), um seine Dienste überhaupt anbieten zu können. Daher haben viele Nutzer ihre WhatsApp-Accounts gekündigt und sind beispielsweise zu Threema gewechselt, als bekannt wurde, dass WhatsApp von Facebook gekauft wurde – denn nichts hält Facebook davon ab, die Metadaten von WhatsApp in vollem Umfang zu nutzen.

Und mit je mehr anderen Daten man sie in Beziehung setzen kann, desto wertvoller werden Metadaten. Das Entstehen dieser Daten kann man kaum vermeiden – dann schon eher, dass sie einem Datenmonopolisten in die Hände fallen.

Be the first to comment

Leave a Reply

Your email address will not be published.


*