Eine Folge einzelner oder mehrerer Aktivitäten werden als Prozess bezeichnet (vgl. Hansen und Neumann, 2005, S. 234). In einem Unternehmen laufen verschiedenen Prozesse ab, die Teilaufgaben und somit Teilergebnisse zur Folge haben. Dabei bauen die Prozesse aufeinander auf, bilden Prozessketten, durch die die entsprechenden Kunden- und Unternehmensbedarfe erfüllt werden können. Ein Verfahren, dass Prozessketten abbildet und untersucht ist das Process Mining.
Process Mining dient der Konstruktion und Visualisierung von Geschäftsprozessen durch Einbindung und Verarbeitung systembasierender Informationen. Klassisches Prozessdesign wird durch Software ersetzt. Process Mining wird als Verbindung zwischen Data Mining und Business Process Management verstanden. Data Mining dient dazu, große Mengen an Informationen zu untersuchen, um in diesen Datensätzen Muster zu erkennen.
Um Process Mining zu betreiben, werden Daten aus unterschiedlichen Systemen, z.B. ERP-Systemen aggregiert. Diese Systeme speichern alle Informationen zu Start- und End-Aktivitäten und Transaktionsdaten als Protokoll ab. Die protokollierten Daten werden Log-Daten genannt und sind zielgerichtete Ausführungen der Prozesse (vgl. Ehrich, 2020). Anhand der Log-Daten wird unter Zuhilfenahme von Process-Mining-Algorithmen (PMA) der Prozess in einem Modell dargestellt (vgl. Van der Aalst et al., 2007, S. 1). Zur Visualisierung der Ergebnisse aus den PMA eignet sich die Form der ereignisgesteuerten Prozessketten (EPK‘s) (vgl. Abt und Mülder, 2010, S. 263-269). Ziel der Visualisierung ist es, das Wissen aus den Prozessen innerhalb der Systeme allen Prozessbeteiligten zur Verfügung zu stellen.
Ein Event-Log, ein Datensatz aus den Log-Daten, stellt den Input im Process Mining dar und enthält die Informationen über Aktivitäten im Prozess. Diese Aktivitäten werden von bestimmten Prozessinstanzen, die den Prozess durchlaufen, ausgelöst (vgl. Nakatumba und Van der Aalst, 2009, S. 3f.). Aktivitäten sind also absolvierte und somit erledigte Aufgaben bzw. Arbeitsschritte in der Prozessinstanz. Ereignisse beziehen sich immer auf eine Aktivität und auf eine Prozessinstanz (vgl. Van der Aalst et al., 2007, S. 1). Jedes Ereignis besitzt darüber hinaus einen Zeitstempel („time-stamp“), der angibt, wann die Aktivität ausgeführt wurde. Es gibt noch weitere Informationen, die in einem Ereignis gespeichert und ausgelesen werden können, wie z.B. die Personen, die die jeweilige Aktivität ausführen. Durch die Angabe des Zeitpunktes und der Information welcher Benutzer den Prozess ausgeführt hat, ergibt sich eine Spur („event-traces“). Mehrere Spuren ergeben den sequenziellen verlauf der Prozessinstanz wieder (vgl. Van der Aalst et al., 2007, S. 1; vgl. Bratosin / Siderova / Van der Aalst, 2010, S. 43).
Da der Event-Log durch einen PMA dargestellt wird, muss der PMA den in den Event-logs enthaltenen Prozess sehr genau skizzieren. Häufige auftretende Probleme hierbei sind zum Beispiel (vgl. Van der Aalst und Weiters, 2004, S. 7-12):
- „Loops“ (Schleifen): Wiederkehrende Muster und Ereignisse, welche erst durch bestimmte Interaktionen durchbrochen werden und Prozesse in die nächste Prozessinstanz senden
- „Hidden Tasks“ (Unsichtbare Aktivitäten): Aktivitäten, welche nicht durch Personen, sondern eventuell durch im Quellcode der IT-Systeme verborgene Auslöser, nicht in die Logs geschrieben werden
- „Duplicat Tasks“ (doppelte Aktivitäten)
- „non-free-choice constructs“ (nicht freie Entscheidungskonstruktionen)
Lang, 2008 beschreibt, dass es den „einen“ Algorithmus, der alle Probleme löst, nicht geben kann, sondern dass es wichtig ist, die Algorithmen auszuwählen, die die konkret gestellte Aufgabenstellung am besten lösen und somit die auftretenden Probleme umgehen können.
Die nachfolgende Abbildung zeigt die Vorgehensweise und die Typen des Process Mining.
Vorgehensweise und Klassen des Process Mining, Quelle: in Anlehnung an Rozinat, 2010, S. 4.
Process Mining Typen
Die erste Klasse ist die Process Discovery. Basierend auf dem Event-log wird der reale Ablauf der Prozesse in einem Prozessmodell skizziert. Das Modell ist zu Beginn nicht bekannt oder vorgegeben, sondern wird durch den PMA erstellt (vgl. Van der Aalst und Günther, 2007, S. 3). Damit wird im Prozessmodell stets der IST-Zustand, sprich der aktuelle Zustand der Prozesse dargestellt (vgl. De Medeiros et al., 2007, S. 2f.; vgl. Rozinat, 2010, S. 8-13).
Durch Conformance-Checking wird ein Prozess entdeckt und mit einem vorher definierten Prozessmodell verglichen. Dabei beschreibt das vordefinierte Prozessmodell den SOLL-Zustand (vgl. Van der Aalst und Günther, 2007, S. 3.). Durch den Direktvergleich können Abweichungen im Prozess entdeckt werden. Zudem ergibt sich der Effekt, Prozesse möglichst anzupassen und dadurch zu verbessern. Dies ist vergleichbar mit der Phase der kontinuierlichen Verbesserung des Geschäftsprozessmanagements (vgl. Rozinat et al., 2006, S. 1; vgl. Rozinat, 2010, S. 13-15).
In der Phase Extension ist ebenfalls ein vordefiniertes Modell enthalten. Das Modell soll hierbei, basierend auf einem Event-Log, um eine neue Betrachtungsperspektive erweitert werden. Dies geschieht auf Basis zusätzlicher Informationen, wie zum Beispiel Durchlaufzeiten, die dem Event-Log zusätzlich zur Verfügung gestellt werden. Auf diese Weise lassen sich der kritische Pfad und mögliche Verzögerungen aufzeigen (vgl. Van der Aalst und Günther, 2007, S. 3).
Quellenangaben
ABTS, DIETMAR und MÜLDER, WILHELM, 2010, Masterkurs Wirtschaftsinformatik, Wiesbaden: Vieweg + Teubner Verlag.
BRATOSIN, CARMEN / SIDOROVA, NATALIA / VAN DER AALST, WILL, 2010, Discovering process models with genetic algorithms using sampling, Berlin / Heidelberg: Springer Verlag.
DE MEDEIROS, ANA KARLA ALVES / WEIJTERS. A. J. M. M. / VAN DER AALST, WILL, 2007, Genetic Process Mining: An Experimental Evaluation: Journal of Data Mining and Knowledge Discovery 14 (2), S. 245-304).
EHRICH, JONNY, 2020, Was ist Process Mining und wie passt es zum Geschäftsprozessmanagement? [online] [Zugriff am 09.10.2020].
HANSEN, HANS ROBERT; NEUMANN, GUSTAF, 2005, Wirtschaftsinformatik, Band 2 Grundwissen der Ökonomik. Betriebswirtschaftslehre, UTB Wirtschaftswissenschaften.
LANG, MARTIN, 2008, Prozess-Mining und Prozessbewertung zur Verbesserung klinischer Workflows im Umfeld bilderzeugender Fächer, Nürnberg: Friedrich-Alexander-Universität Erlangen-Nürnberg [online][Zugriff am: 23.01.2021].
Verfügbar unter: https://opus4.kobv.de/opus4-fau/frontdoor/index/index/docId/690
NAKATUMBA, JOYCE und VAN DER AALST, WIL, 2009, Analyzing resource behavior using process Mining: Processing of the 5th International Workshop on Business Intelligent.
ROZINAT, ANNE / MANS, R. S. / VAN DER AALST, WILL, 2006, Mining CPN Models, Aarhus: University of Aarhus.
ROZINAT, ANNE, 2010, Process Mining: Conformance and Extension, Eindhoven: Press Facilities.
VAN DER AALST, WIL / REIJERS, H. A, / WEIJTES, A. J. M. M. / VAN DONGEN, B. F. / DE MEDEIROS, ANA KARLA / SONG, M. / VERBEEK, H. M. W., 2007, Business processing mining: An industrial application: Information System, 32 (1).
VAN DER AALST, WIL und WEIJTERS, A. J. M. M., 2004, Process Minings: A research agenda: Computer in Industry 53 (3).
VAN DER AALST, WILL und GÜNTHER, C. W., 2007, Finding Structure in Unstructed Processes: The Case for Process Mining, Los Alamitos, IEEEE Computer Society Press: S. 3-12.