GoogleWatchBlog

Nicht nur zu Werbezwecken: Googles Algorithmen analysieren alle Dokumente aus Google Docs

» Web-Version «

Bis auf ganz wenige Ausnahmen bietet Google alle Produkte für Privatpersonen kostenlos an und fordert keine Gegenleistung für diese Dienste. Das ist natürlich nur die halbe Wahrheit, denn jeder Nutzer bezahlt mit seinen Daten, die Stück für Stück für den Aufbau von Profilen verwendet werden. Durch einen kleinen Fehler ist nun ans Licht gekommen, dass Google selbst Dokumente aus Google Docs analysiert und daraus Rückschlüsse auf den Nutzer zieht.


Google bietet sehr viele Produkte an, die auf den ersten Blick keine Einnahmen generieren: Photos, Drive, Calendar, Translate, die Messenger und einiges mehr sind alle vollkommen kostenlos und enthalten keine Werbung. Doch sie sind deutlich mehr als nur Markenbindung, denn durch all die darin gesammelten Daten wird das Profil des Nutzers immer weiter geschärft, so dass die angezeigt Werbung in der Websuche, bei YouTube oder auf Webseiten Dritter via AdSense noch präziser werden kann. Das ist soweit bekannt.

Durch einen kleinen Fehler haben gestern eine Reihe von Nutzern nicht auf ihre Dokumente aus Google Docs zugreifen können, da dieses angeblich die Nutzungsbedingungen verletzt. Das Problem wurde relativ schnell behoben und Google hat sich für den Fehler entschuldigt, hat damit aber etwas neues losgetreten. Hier erst einmal das Statement von Google, in dem es heißt dass die Dokumente versehentlich als Missbrauch markiert und daraufhin gesperrt worden sind.

we made a code push that incorrectly flagged a small percentage of Google Docs as abusive, which caused those documents to be automatically blocked. A fix is in place and all users should have full access to their docs.

Nun kam natürlich die Frage auf, wie diese Dokumente denn eine solche Markierung bekommen können. Natürlich durchlaufen auch alle Dokumente in Google Docs unzählige Algorithmen und Scans, aber offenbar geschieht das nicht nur zu Verarbeitungs- sondern auch zu Analyse-Zwecken. In den Datenschutzbestimmungen heißt es:

Unsere automatisierten Systeme analysieren Ihre Inhalte (einschließlich E-Mails), um Ihnen für Sie relevante Produktfunktionen wie personalisierte Suchergebnisse, personalisierte Werbung sowie Spam- und Malwareerkennung bereitzustellen.

Auch das ist soweit bekannt, bisher wusste aber wohl kaum jemand, dass davon auch Google Docs betroffen ist.

Die Betroffenen Nutzer des Problems haben übrigens alle über kontroverse Themen geschrieben: Waldbrand-Verbrechen, über das postsozialistische Osteuropa sowie über akademische Streitpunkte.



In einem nicht mehr ganz so leicht zugänglichen und gut versteckten Support-Dokument heißt es dann zur Erfassung von Informationen:

Erfasst werden Informationen wie Nutzungsdaten, Einstellungen, Gmail-Nachrichten, Google+ Profil, Fotos, Videos, Browserverlauf, Kartensuchen, Dokumente oder andere von Google gehostete Inhalte. Unsere automatisierten Systeme analysieren diese Informationen beim Senden, Empfangen und bei der Speicherung. Diese Erfassung kann alle Inhalte betreffen, die unsere Systeme durchlaufen.

Dort ist ausdrücklich auch die Rede von Dokumenten. Googles Scanner analysieren also auch, welche Informationen in einem Docs-Dokument eingegeben werden. Und offenbar kommt dabei nicht nur ein Stichwort-Scan zu Werbezwecken zum Einsatz, sondern auch eine tiefere Analyse der Inhalte und Eingaben. Wer also ein rechtlich vielleicht nicht ganz so einwandfreies Dokument verfasst oder bei Google speichert, muss möglicherweise mit einer Sperre rechnen.

Was das nun genau bedeutet kann jeder für sich selbst entscheiden, aber dass ein solcher tiefer Scan aller verfassten Dokumente stattfindet, sollte man vielleicht beim nächsten Verfassen bedenken. Da aus einem Dokument – meiner Meinung nach – keine relevanten Informationen wie aus einer E-Mail herausgelesen werden können, gäbe es eigentlich keinen tieferen Grund für eine Analyse abseits der Indexierung für die Suchfunktion.

Ich denke, Google sollte die genaue Verwendung der Daten noch einmal klar stellen. Gegenüber der Washington Poste wollte man sich zur Tatsache der Google Docs-Analyse nicht äußern. In einem weiteren Statement hat man lediglich geäußert, dass die Scanner zum Schutz vor Viren und Malware zum Einsatz kommen, was aber hier wohl eindeutig nicht der Fall gewesen ist.

[Washington Post]

UPDATE
» Google stellt klar: Alle Nutzerdaten und Dokumente werden nur von Algorithmen ausgewertet


Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | Jetzt den GoogleWatchBlog-Newsletter abonnieren