Big Data in der Kritik: eine kritische Betrachtung

Big Data. Zwei Wörter, welche in Verbindung gebracht eine revolutionäre Art und Weise der Datenspeicherung, -verarbeitung und –analyse darstellen. Obwohl Big Data von vielen als zukunftsweisend angesehen werden und viele Vorteile und Chancen der Big Data erkenntlich sind, gibt es immer wieder Personen, welche Kritik an Big Data äußern. In dem Artikel „Chancen und Risiken von Big Data“ wurden bereits einige Nachteile und Risiken erwähnt, welche mit der Nutzung von Big Data einhergehen können. In diesem Artikel sollen weitere Kritikpunkte von Big Data erläutert werden.

Big Data in der Kritik: Fehlinterpretation

Aufgrund der unterschiedlichsten Möglichkeiten bei der Analyse von Big Data können sehr gute Verbindungen zwischen verschiedenen Daten und Datensätzen hergestellt werden. Problem hierbei stellt jedoch nicht das Programm, sondern der Analyst hinter der Software dar. Aus hunderten von Verbindungen der Daten untereinander müssen Analysten tatsächliche Korrelationen herleiten und Schlüsse daraus ziehen. Ein erfundenes Beispiel hierfür ist, dass die Einführung des ersten iPhones in den Markt und die bis heute ansteigenden Verkäufe mit der Anzahl von Morden seit jenem Jahr korrelieren. Eine solche Korrelation lässt sich von Analysten schnell als fragwürdig erkennen. Jedoch können in der Praxis häufig Korrelationen auftreten, welche meist viel komplexer und schwerer zu erkennen sind. Ausgehend aus einer falschen Korrelation können somit falsche Entscheidungen getroffen werden, welche den Erfolg eines ganzen Unternehmens ausmachen können.[1]

Big Data in der Kritik: Manipulation

Manipulation bezieht sich in diesem Fall nicht auf illegale Aktivitäten durch Außenstehende, sondern auf die Manipulation der vom Programm festgelegten Algorithmen. Als Beispiel kann man hier die Verwendung von Analysesoftware für Schüleraufsätze verwendet werden. Das Programm analysiert die Aufsätze und registriert Aufsätze mit langen Sätzen und komplizierten Wörtern als gute Aufsätze. Sobald jedoch die Schüler hinter den Algorithmus der Software steigen, werden sie damit beginnen, lange Sätze mit komplizierten Worten zu schreiben. Unabhängig davon wie sinnig die Sätze und verwendeten Worte sind, wird das Programm die Aufsätze als gut einstufen, da die gewünschten Faktoren erfüllt worden.

Dieses Beispiel zeigt, dass die Ergebnisse gezielt manipuliert werden können, sobald die für die Analyseprogramme vorhandenen Algorithmen erkannt werden.[2]

Big Data in der Kritik: Echokammer-Effekt

Der Echokammer-Effekt tritt vor allem bei der Analyse von Daten aus dem Internet auf. Hierbei kann es passieren, dass Fehler, welche bei einer Analyse mittels eines Programms auftreten auf einer Webseite hochgeladen werden. Nun muss das gleiche Programm jedoch Texte und Daten aus dem Internet analysieren und stößt hierbei auf die Daten, welche vorher mit Fehlern auf einer Webseite hochgeladen worden. Dies hat zur Folge, dass das Programm mit den Fehlern weiterarbeitet, diese falsch analysiert und als Folge dessen falsche Schlüsse gezogen werden. Diese Schlüsse werden ebenfalls wieder hochgeladen und der Teufelskreis beginnt erneut.

Ein Beispiel hierfür ist Google Translate, welches auf Wikipedia-Artikel unterschiedlicher Sprachen zurückgreift und Muster zwischen den Übersetzungen treffen soll. Problem hierbei ist jedoch, dass einige der Wikipedia-Artikel bereits per Google Translate übersetzt worden und Fehler beinhalten. Durch den Vergleich der Sprachen werden diese Fehler weiter verstärkt.[3]

Big Data in der Kritik: Big Data sind Unfair

Diese Aussage bezieht sich auf Minderheiten, welche bei der Analyse von Daten auftreten. Leider gibt es immer weniger Daten über Minderheiten. Als Folge dessen lassen sich auch immer schlechter Modelle über Minderheiten im Gegensatz zu der allgemeinen Bevölkerung bilden. Wenn hierbei zusätzlich automatisierte Entscheidungen realisiert werden, ist die Wahrscheinlichkeit sehr hoch, dass diese die statistisch dominante Gruppe bevorzugt und nicht die Minderheit.

Zusätzlich kommt hierzu, dass Muster die für eine Mehrheit gelten, für eine Minderheit ungültig sein können. Beispiel hierfür wäre, dass in unterschiedlichen Kulturellen Namen auf unterschiedliche Art und Weise geschrieben sein können. So können Namen in der einen Kultur kurz und allgemein sein oder in einer anderen Kultur lang und eindeutig sein.

Um Fairness letztendlich zu erreichen, müssen komplexe Entscheidungsregeln gefunden werden. Diese Suche ist jedoch sehr rechenintensiv und kann aufgrund fehlender Ressourcen als Folge haben, dass Minderheiten bei der Entscheidungsfindung außer Acht gelassen werden.[4]

Big Data in der Kritik: Ungenauigkeit der Daten

Genau diese Tatsache, dass eine Vielzahl von Daten ungenau und unterschiedlich zu interpretieren sind, veranlasste die Google Flu Trends in ihrer Vorhersage zu scheitern. Die Google Flu Trends nutzten die Suchbegriffe der Menschen bei Google, um den Verlauf der Grippe vorherzusagen. Hierbei wurden auch Symptome und mit Grippe in Verbindung gebrachte Suchwörter genutzt. Aufgrund der ungeheuren Anzahl an Suchanfragen, welche sowohl auf Grippe, als auch auf andere Krankheiten schließen ließen, war die Anzahl der von Google geschätzten Infizierten weit über der tatsächlichen Anzahl an Erkrankten.[5]

Fazit

 Die Kritik, welche hinsichtlich der Nutzung von Big Data im Netz geübt wird ist riesig. Die hier dargestellten Kritikpunkte, sind die am häufigsten genutzten Punkte von Kritikern. Hinzu kommen die Risiken, welche im Artikel „Chancen und Risiken von Big Data“ beleuchtet wurden, welche zu enormer Kritik führen. Besonders der Punkt des Eingriffes in die Privatsphäre ist sehr häufig vorhanden. Big Data Kritik lässt sich an so gut wie jeder Stelle unseres Lebens anführen. Sei es in den sozialen Medien, der Wissenschaft oder auch der Bildung. Trotz dieser Risiken erkennen viele der Kritiker Big Data als zukunftsweisende Möglichkeit an. Die Aufgabe der Wissenschaftler und Analysten ist es nun die Risiken zu eliminieren und Vorteile durch Big Data stärker voranzutreiben.

Quellenangaben

[1] Vgl. Marcus, Gary; Davis, Ernest (06.04.2014): “Eight (No, Nine!) Problems With Big Data”, unter: https://www.nytimes.com/2014/04/07/opinion/eight-no-nine-problems-with-big-data.html (15.12.2018).

[2] Vgl.Ebd.

[3] Vgl.Ebd.

[4] Hardt, Moritz (26.09.2014): „How big data is unfair“, unter: https://medium.com/@mrtz/how-big-data-is-unfair-9aa544d739de (15.12.2018).

[5] Pryadharshini (02.12.2016): “is big data overhyped?”, unter: https://www.simplilearn.com/is-big-data-overhyped-article (15.12.2018).