Big Data

Gestern Abend war ich bei einer Veranstaltung zum Thema Big Data, d.h. es ging um die Sammlung und Analyse großer Datenmengen. Seit den Enthüllungen von Snowden weiß jeder, dass die NSA systematisch Daten sammelt und Algorithmen verwendet, die ein Bild der Datenproduzenten liefern. Das tun Google, Apple, Amazon, Facebook und wie sie alle heißen auch - und das alles nutzen sie dann nicht nur kommerziell, sondern liefern es auch noch an die Geheimdienste...

Insofern war an dem Abend nicht viel Neues zu hören.

Was für mich aber spannend und interessant war, ist der Einblick in die Fähigkeit zur Textanalyse, den diese Programme inzwischen entwickelt haben. Dabei geht es, um das gleich zu sagen, nicht um Inhalte, sondern um formale Aspekte von Texten. Das beste Mittel, so wurde berichtet, um einen Text einem Autor zuzuordnen ist die Analyse der Häufigkeit von Dreibuchstabenkombinationen. Die Wortwahl kann vom Autor bewußt variiert werden, um nicht erkannt zu werden, aber die Kombination von drei hintereinanderstehenden Buchstaben erfolgt offenbar bei allen Menschen unbewußt, so dass dies zu ihrer Identifikation - wie Fingerabdrücke oder die DNA - verwendet werden kann.

Die Gedanken sind frei - weil sie nicht von außen beobachtbar sind. Womöglich ist Mutismus die einzige Form, sich diese Freiheit zu bewahren (man kennt das ja von diesen schweigsamen Menschen, die viel zu sagen hätten, es aber nicht tun - und sicher nie auf die Idee kämen, einen Blog zu verfassen).