过程挖掘(Process Mining)1——始于颜值

过程挖掘是什么?

按照过程挖掘之父Wil van der Aalst 的说法,他定义的过程挖掘(PM,Process Mining)是从现有事件日志中挖掘知识以发现、监控和改进实际流程。

根据这个定义,我们关注其中两个名词——事件日志和实际流程。

不难理解,事件日志是实际流程成千上万次执行的记录,这是提供给过程挖掘的粮食,是驱动过程挖掘的能量,是过程挖掘理念产生的重要缘由。

实际流程这个概念用得很好,实际流程就是真实世界中,有别于人类脑海中构建的、概念上设计的流程,实际流程中的执行实例是更贴合真实的流程,更具客观性并且可以表达各种可能。

过程挖掘与业务流程管理的关系?

业务流程管理(BPM,Business Process Management)是一门结合各种理论和方法,以设计,执行,控制,测量和优化业务流程为目的的学科。

可以从BPM生命周期来了解BPM大致是做什么的,BPM以业务流程为中心,因此其生命周期的活动是围绕流程模型的生命周期的,从图中可以看出是对流程模型的持续性监控、处理和优化。

BPM生命周期
BPM生命周期各阶段说明
阶段 说明
(重)设计 设计一个流程,在重设计时是开始BPM生命周期的一次迭代。
配置/实现 模型被实现为一个可运行的系统。
启动/监控 当运行系统可支持设计的流程时,则流程系统可被启动和监控。
调整 仅一些预定义的控制被加入或重配置到流程中,以调整流程的正确运行。
诊断/需求 发现流程错误,或者因为流程环境的改变而需要引入新需求。

从BPM的视角和PM的特点来看,根据上图BPM生命周期,由于PM以数据为中心,可以说PM能在BPM生命周期中的启动/监控结点和诊断/需求阶段发挥作用。实际上,原本的BPM是模型驱动的方法,并没有把隐藏在数据中的知识考虑到流程模型中,直到现在BPM社区才开始意识到与数据相关的启动/监控、调整和诊断/需求阶段的重要性,数据驱动也成了BPM的一个重要特性,可以说PM在BPM可以发挥重要甚至关键的作用了。

虽然说PM在业务流程中可以发挥很大的作用,但是PM并不局限于BPM,PM是从实际流程的事件日志中挖掘信息和知识,因此任何记录事件信息的流程都可以考虑使用PM。实际上,现在PM的研究在行为模型上(人类行为、软件行为)都发现有很好的发挥作用。

过程挖掘与数据挖掘的关系?

从数据中发现隐藏的知识和信息是数据挖掘的目标,从这一点上,过程挖掘从事件日志中挖掘实际流程的潜在知识和信息,可以把过程挖掘归类为数据挖掘。然而,很多数据挖掘方法并没有对实际流程的事件日志进行挖掘的研究,因此过程挖掘弥补了这一缺口。

值得注意的是,从过程挖掘的定义来看,过程挖掘并没有限定你使用什么方法,只要是对实际流程的事件日志挖掘知识和信息,不管你是用过程发现(PD,Process Discovery)算法、一致性检验(CC,Conformance Checking),还是用决策树算法、关联规则分析等,都可以说你是在过程挖掘。因此,过程挖掘确实就是数据挖掘在流程层面的数据上的应用,当你打算在流程数据上做分析,或者你的工作本身就是与流程和流程数据打交道,过程挖掘的方法和数据挖掘的方法都是值得学习和使用的。

管理学还是计算机科学?

上面介绍了PM与BPM、DM的关系,可以说PM既有管理学的属性,由于计算机科学(或者说数据科学)的属性,但是应该从特定的角度来决定这样的关系。实际上,与DM一样,PM也是在设计、实现和分析某个应用来发挥作用的。比如一个企业需要对其内部的某个产品的某个流程启动过程挖掘分析,从设计上需要决定使用哪些数据?从流程的哪个抽象层次切入?数据的利用要在哪个粒度层面上?使用哪些工具、方法和算法?为了解决什么问题等等等等;从实现上比如数据的处理、工具的配置、算法的实现等等;从分析上就是对挖掘的结果进行分析,指出结果为这家企业带来了什么信息?能否引出新的PM问题?有什么产品或者产品流程的缺陷等等。因此一个PM项目可能涉及到很多领域(管理学、流程科学、计算机科学等),需要各种人员的参与(管理员、流程分析师、计算机人员、PM专家、数据分析师、决策者等等)。

实际上,流程科学的不断发展,从静态流程到动态流程,到运行时分析,再到数据驱动,其目的是提高生产力,方法也不断在进步,并且在各种领域上发挥了重要进步。过程挖掘是流程科学的最新发展结果,并且已经发挥了很大的作用,在流程优化上已经被证明是高效的方法。在西方,流程科学在企业中是重要的研究内容,企业内部存在各种类型的流程(产品流程、管理流程等),其在企业生产力的提高上发挥了很大的作用。在我国,流程科学已经开始得到越来越多的重视了,各种企业不得不把BPM引入,高校中信息系统不断优化升级,可以很明显看出逐渐把流程科学化了,中国的产业升级离不开产业流程的优化,流程科学化是重要的工作,相信不管是BPM还是PM,它们作为高效的流程优化工具,必然在中国开花结果。

 

 

后面的内容:介绍PM的基本内容,主要是PM的要素、方法,其三大方向的全面介绍,现阶段重点在于实现PM而不在于应用PM。会介绍一些PM的最新研究进展。关于PM的应用,后面会写一点。

                     PM介绍的内容主要来自Wil van der Aalst大佬的Process Mining Data Science in Action Second Edition,作为一次学习总结过程。本书可以在Springer上下载。

                     关于BPM,介绍阅读的书:Fundamentals of Business Process Management ,同样可以在Springer上下载

                     数据挖掘方法网上已经有很多内容不多推荐

                     关于PM的应用,可以关注比赛BPIC https://icpmconference.org/2020/bpi-challenge/

                    

 

猜你喜欢

转载自blog.csdn.net/hyhy12580/article/details/110294114