PREDICTIVE ANALYTICS SOFTWARE

In unseren schon veröffentlichten Blogartikeln haben wir uns schon mit der Frage „Was ist Predictive Analytics?“ auseinandergesetzt und zudem einige Methoden der prädiktiven Analyse thematisiert. Dieser Artikel soll sich um die praktische Anwendung der Modelle drehen, wobei gängige Predictive Analytics Software vorgestellt werden soll, die die Daten aus der Vergangenheit mittels statistischer Methoden und Algorithmen analysiert. Dem Anwender werden dann die aufbereiteten Informationen, beispielsweise als Trends und deren Auftretenswahrscheinlichkeiten ausgegeben.

RapidMiner Studio

Dieses Tool bietet verschiedene Anwendungsmöglichkeiten, wie maschinelles Lernen oder Data Mining. Doch ebenso kann es für Predictive Analytics verwendet werden, da große Datenmengen aus einer Vielzahl an Quellen analysiert und modelliert werden können. RapidMiner bietet zahlreiche Algorithmen und Aufbereitungsfunktionen für Daten und es unterstützt den Data Mining Prozess durch die Visualisierung, Plausibilitätsprüfung und die Optimierung von Daten. [1]

KNIME Analytics

KNIME – der Konstanz Information Miner – ist eine open source Software für Datenanalyse und die Erstellung visueller Prognosemodelle. Das Programm beinhaltet vielseitige Komponenten des maschinellen Lernens und Data Mining aufgrund des zugrundeliegenden modularen Pipelining-Konzepts. Dem Nutzer wird eine graphische Oberfläche geboten, die die Datenvorverarbeitung, -modellierung,-analyse und -visualisierung optimal unterstützt. [2]

IBM PREDICTIVE ANALYTICS

IBM beinhaltet ein Werkzeug, welches die Kundenzufriedenheit oder das -ärgernis voraussagt, um gute Werte beizubehalten und um Einnahmen zu steigern. Zusätzlich verfügt IBM Predictive Analytics über betriebswirtschaftliche Analyseverfahren, mit denen Unternehmen eine Hilfestellung, beispielsweise für die Einschätzung von Betriebskosten oder Produktqualität bekommen. Für Unternehmen mit großen Datenmengen ist IBM eine Unterstützung zur Organisation derer, zur Darstellung von Beziehungen unter den Daten und zur Aufstellung von Prognosen. Die Software erkennt außerdem Betrug und Gefahren, bevor sie dem Unternehmen Schaden zufügen. Außerdem kombiniert sie die Daten gut verständlich. Die Ergebnisse werden visualisiert und in einfacher Sprache ausgegeben, sodass der Anwender die Informationen gut versteht. [3]

SAP PREDICTIVE ANALYTICS

SAP Predictive Analytics vereint statistische Analysen mit Data Mining und Predictive Analytics, was exakte Prognosen über zukünftige Ereignisse ermöglicht. Das Angebot der Software umfasst die Datenerforschung, und -visualisierung, sowie die Aufstellung von Prognosen, um die Analysekapazität optimal auszunutzen. Um das Kundenverhalten einmalig präzise vorauszusagen, werden bei SAP Predictive Analytics Prognosemodelle erstellt, zum Beispiel durch Cross-Selling, Up-Selling, sowie die Vorbeugung von Kundenabwanderung. [4]

MATLAB

MATLB ist eine Software, die zur Lösung mathematischer Modelle dient. Eine Desktop-Umgebung für iterative Analysen und Entwicklungsprozesse sind dabei mit einer Programmiersprache, in der Sie Matrix-basierte Mathematik direkt formulieren können, kombiniert. Die Ergebnisse werden graphisch dargestellt.

MATLAB gilt als die einfachste und produktivste Softwareumgebung für Ingenieure und Wissenschaftler. Dabei sind Haupteinsatzgebiete die numerische Simulation ebenso wie Datenerfassung, Datenanalyse und die Auswertung derer. [5]

WEKA DATA MINIMG

Wakiato Environment for Knowledge Analysis, kurz Weka, ist eine Zusammenstellung von Algorithmen des maschinellen Lernens für Data Mining Problemstellungen. Enthalten sind unter anderem Werkzeuge für Vorverarbeitung, Klassifikation, Regression, Clustering und Visualisierung von Daten. Außerdem besteht die Möglichkeit, neue Entwürfe für maschinelles Lernen zu entwickeln. Die Methoden bauen auf der Annahme, dass die Daten als einzelne Datendateien verfügbar sind, wobei jeder Datenpunkt durch eine festgelegte Anzahl von Attributen beschrieben wird. [6]

R SOFTWARE ENVIRONMENT

R ist eine Softwareumgebung für statistische Berechnungen und graphische Darstellungen. Die Anwendung beinhaltet Möglichkeiten zur Datenbearbeitung, -berechnung und -visualisierung, die auf einer Vielzahl von Methoden zur Datenanalyse, wie lineare und nichtlineare Modellierung, Klassifikation und Clustering basieren. Für den Nutzer besteht außerdem die Möglichkeit, zusätzliche Funktionalitäten durch das Hinzufügen neuer Funktionen zu gewinnen. Die Software ist gut handhabbar und kompatibel mit Betriebssystemen. [7]

SAS PREDICTIVE ANALYTICS

Bei dieser Softwareanwendung handelt es sich um ein Werkzeug zur Analyse großer Datenmengen und eine Hilfestellung für Kunden zur Verbesserung der Arbeitsleistung und zum Finden optimaler Entscheidungen. SAS Predictive Analytics dient als Unterstützung zur Lösung komplizierter Probleme.

Die Software enthält verschiedene Tools. Dabei handelt es sich zum einen um ein Werkzeug zur visuellen Analyse, bei der neue Muster und Beziehungen zwischen Daten erkannt werden, die anfangs noch nicht ersichtlich waren. Ein weiteres Werkzeug dient der Gestaltung des Data Mining Prozesses durch das Erstellen von Modellen, die es ermöglichen, komplexe Daten zu analysieren. Andere Bestandteile der Software dienen dem Verwalten der verschiedenen Analysemodelle, der eigentlichen Analyse der Daten und der optimalen Entscheidungsfindung. [8]

ORACLE ADVANCES ANALYTICS

Oracle Advanced Analytics ist eine Kombination von Oracle Data Mining und Oracle R Enterprise. Die Software bietet eine Plattform für prädiktive Analysen, Data Mining, Text Mining, statistische Analysen, fortgeschrittene numerische Berechnungen und interaktive Grafiken. In der Datenbank können analytische Methoden entwickelt und automatisiert werden. Die Software liefert Data Mining Anwendungen in der Datenbank und eine Integration mit open source R. Oracle kann in der Entwicklung und Einschätzung von pädiktiven Analysemodellen angewendet werden. [9]

MICROSOFT R

R ist eine Programmiersprache für statistische Berechnungen, maschinelles Lernen und Grafiken. Die Software ist leistungsfähig und beliebt – sie wird von unzähligen Nutzern und Entwicklern benutzt und unterstützt.

Zu der Microsoft R Produktfamilie gehören vier Komponenten. Dazu zählt Microsoft R Server, eine Analyseplattform, die eine Bandbreite von Werkzeugen für Analyse, Visualisierung und Modellierung bereitstellt. Big Data Statistiken, prädiktive Modellierung und Fähigkeiten des maschinellen Lernens werden unterstützt.

Microsoft R Client ist ein Werkzeug für Hochleistungsanalysen von Daten. Microsoft R Open ist eine open source Anwendung für statistische Analysen und Datenwissenschaft und SQL Server R Services bietet die Möglichkeit zur Entwicklung intelligenter Anwendungen, die neues Wissen generieren. [10]

Quellenangaben

[1] – [10] Vgl. Perlea Barea, Cecilia; Euba Álvarez, Iñigo; Cogollo Huete, Alfonso: From predictive to prescriptive: Transforming business decisions with analytics. S. 82-91