过程挖掘(Process Mining)2——入门:要素、基本概念与三大类型

要素

使用过程挖掘时需要准备的东西,主要是业务理解、事件日志、过程挖掘技术和应用目标

要素 说明
业务理解 首先需要充分理解挖掘对象,即业务流程的内容,最直观的是其原始流程模型,但是业务理解应在这里插入代码片该覆盖到业务的所有方面,各个活动及其属性是什么含义
事件日志 执行业务流程的案例的信息都记录下来,存储为事件日志。因为过程挖掘起步晚,企业没有存储可明确用于过程挖掘的事件日志,所以通常存储的数据需要经过转换才能进行过程挖掘。IEEE过程挖掘工作小组提供了两种存储标准——MXML和XES,两种都是XML形式的,现在一般都使用XES
过程挖掘技术 过程发现、一致性检验、机器学习、数据挖掘和深度学习等可以用于挖掘潜在模式的算法和技术都可以被考虑进去
应用目标 使用过程挖掘为了解决什么问题,通常为了得到实际流程的新见解,可以在挖掘过程中发现新问题

基本概念

流程

流程就是一组为了完成某项任务的活动的组成,这些活动存在关联关系。
需要区分两种概念的流程——概念流程实际流程
概念流程(to-be)就是理想化的、由人设计的、纸上的流程。
实际流程(as-is)就是现实执行的流程。

比如让你画出点外卖的流程模型图,你觉得的概念流程(变迁系统表示)长这样:
图1 你设计的点外卖流程
实际上消费者执行的实际流程是这样:

不按套路出牌

流程模型

流程模型是表示流程的语言,包含控制流式流程模型和声明式流程模型。流程模型包含正式模型和非正式模型。正式模型也称为可运行模型,用于分析和启动;非正式模型用于讨论或文档化。

案例

案例(Case)是指从流程起到到流程终点的一次运行实例,案例具有案例ID(Case ID),有案例层面的属性,有执行流程的活动轨迹。

轨迹

轨迹(Trace)是一串活动序列,是一个案例的执行痕迹,序列中每个元素是案例发生的事件。

事件

事件(Event)是活动的发生,事件的基本属性有案例ID、活动名称和时间戳,分别指示所属案例、所属执行的活动和执行顺序。事件可以有其他附加属性。

下面以小明今天中午点外卖的流程案例举个例子:

事件 时间戳 其他属性
打开外卖app 2021-2-14 11:11:01 app名称:美团外卖
选择商家 2021-2-14 11:11:11 商家名称:暖心食屋
选择产品加购 2021-2-14 11:11:21 产品名称:绝味狗粮,数量:1
结算 2021-2-14 11:11:31 收货地址:广州市番禺区犬犬小区11号狗屋
付款 2021-2-14 11:11:41 付款方式:人脸支付,支付金额:¥11
退出外卖APP 2021-2-14 11:11:51 /

Play-Out、Play-In和Replay

在这里插入图片描述
Play-Out可以理解为流程模型的使用(运行),可用于业务流程的分析和启动。一个工作流引擎可以认为是一个Play-Out引擎。仿真工具就是使用Play-Out引擎来进行试验的,但与工作流引擎不同的是,仿真工具只是在建模的环境下执行,而工作流引擎则与现实环境交互。

Play-In与Play-Out是相反的概念,可以理解为(从数据中)推断(模型)。比如α算法通过事件日志推断出流程模型,就是Play-In的过程,数据挖掘中利用决策树算法计算出的决策树模型,也是Play-In的过程。

Replay是使用事件日志和流程模型作为输入,将事件日志在流程模型上replay。Replay的目的主要有:
(1)一致性检验:日志与模型的差异可以通过replay来检测和定量计算。
(2)用频域和时间信息扩展模型(可视化角度):通过replay日志,可以发现流程的哪些部分被频繁访问,或者从执行时间角度来发现瓶颈(哪部分执行得很慢)。
(3)构建预测模型:预测模型可以通过replay来学习,在模型的不同特定状态时可以做一些预测。
(4)操作支持:replay不局限于只在历史事件日志上,也可以replay仍在运行的案例的部分轨迹,以此检测运行时的deviation,并为接下来的操作提供支持。

三大类型

事件日志可以用来进行三种过程挖掘的任务(或者说过程挖掘这个东西表现的三种形式)。如下图所示
过程挖掘的三大定位

过程发现

过程发现(Process Discovery)是从事件日志中构建流程模型的技术,而不需要任何先验知识。如果事件日志包含资源信息,则可以发现资源相关的模型(如社会网络)。

一致性检验

一致性检验(Conformance Checking)是将现有的流程模型与来自该流程的事件日志作比较的技术。一致性检验被用来检验现实的流程(记录在日志中)是否与流程模型一致。

过程改进

过程改进(Process Enhancement)是借助实际流程记录的事件日志中得到的知识和信息来扩展或改进现有流程(先验模型)的方法。
一种改进是修复(repair),即修改流程以更好反映现实。
另一种改进是扩展(extension),即通过将流程与日志相互关联,为流程模型添加新的视角(比如利用事件的时间戳信息,扩展流程模型的信息如瓶颈、服务等级、吞吐时间和频率等)。

三大类型在过程挖掘中是不止从控制流(control-flow)角度(Perspective)进行,也可以以其他角度使用。过程挖掘中使用到的主要视角有:
控制流视角:专注控制流,即活动可以执行的顺序。这个视角的目标是找到所有可能流程路径的一个好的特征,比如挖掘出一个Petri网或者其他表示流程模型语言。
组织视角:专注事件日志中的资源(resources)信息(比如有那些参与者(actor:如人、系统、角色和部门等)以及它们如何联系)。这个视角的目标或是通过分类不同角色或组织单元的人来结构化系统组织,或是构建社会网络。
案例视角:专注案例的属性。一个案例不仅有它的流程路径、参与角色等属性,也包括其他描述它的各种数据属性及对应的值,比如订外卖的一个流程案例有多少个订单的数据属性。
时间视角:专注事件的频率和执行时间。事件的时间戳属性可以用于发现瓶颈、度量服务等级、监控资源利用情况和预测运行案例的剩余时间等。

过程挖掘与其他技术的比较

业务流程管理BPM与过程挖掘

前面文章已经介绍了BPM和过程挖掘的关系,其实主要关注它们之间的差别,过程挖掘是面向流程的数据挖掘,可以服务于BPM,而BPM则是以流程为中心,任何服务于流程管理的技术都可被应用。

数据挖掘DM与过程挖掘

两者都是从数据中挖掘知识信息,都是数据驱动的挖掘模式的技术,确切地说过程挖掘应当属于一种数据挖掘,然而常见数据挖掘很少以流程为中心(挖掘的模式不是流程模型)。
有些数据挖掘技术很接近过程挖掘,比如序列模式和情节模式挖掘,然而它们并不涉及端到端流程。实际上,在对事件数据挖掘上,很多传统数据挖掘都可以被应用到,比如决策规则学习可以应用到挖掘的流程

精益六西格玛和过程挖掘

精益六西格玛(Lean Six Sigma)是将精益制造和六西格玛的思想结合起来的一种方法论,核心思想就是通过系统性地去掉浪费(waste:或者多余、无用的组成)来提高性能。
精益方法原自日本制造业,丰田生产系统(TPS,Toyota Production System)是一个应用精益制造方法的著名例子。在精益方法中,典型的七种waste类型有:
·运输浪费(Transportation waste):一个产品每次被移动时都会遭遇损坏、丢失、延误的风险,然而运输却是对产品不产生任何改变的过程(没有生产性价值吧)。
·库存浪费(Inventory waste):原材料、半成品和成品都会需要存储,如果这些库存没有在生产处理过程中,则可能是被认定为是库存浪费,因为会消耗资本和空间。
·工作浪费(Motion waste):在生产过程中资源(设备或者人员)的使用总会遭遇或多或少的磨损,而不必要的活动(比如运输、重做)会加速资源的磨损和引入事故风险。
·不必要的浪费(Unnecessary waste):指产品等待处理或运输时浪费的时间。
·过度处理的浪费(Over-processing waste):任何不是对客户需求的满足的多余工作都可以被认为是浪费,比如使用更精确、复杂和高质量的生产组件。
·过度生产的浪费(Over-production waste):生产比客户需求更多的产品也可能是另一种形式的浪费,因为会导致更多的库存空间,而且客户的需要会改变导致多余的产品过时和失去价值。
·缺陷(Defect):重做、废料、缺漏成分、糟糕的工作指令和活动修正都是可能增加大量成本的缺陷。
与精益是通过去除所有没有增加价值的活动不同,六西格玛则是提高活动产生的价值的质量。六西格玛的思想是因为在正态分布中,99.73%的值是落在[μ-3σ,μ+3σ]中,因此六西格玛希望创建的流程产生的偏差如果落在六个标准差以内是非缺陷的,那么其缺陷率可以很低。
精益和六西格玛思想的互补就造就了精益六西格玛方法,一个典型的方法是DMAIC,包含五个步骤:
·定义(Define)问题和设定目标,
·度量(Measure) 关键性能指标和收集数据,
·分析(Analyze)数据以调查的验证因果关系,
·改进(Improve)现有流程,基于上面的分析,
·控制(Control)流程以最小化目标中的偏差。

介绍了精益六西格玛的基本理念,可以看出,过程挖掘可以应用到这些方法中,因为过程挖掘可以帮助分析偏差和低效率。

业务流程再工程BPR与过程挖掘

BPR是一种管理方法,通过四个关键字刻画其特征——基本的(fundamental)、彻底的(radical)、巨大的(dramatic)和流程(process)。Process表示BPR是专注于流程而不是从数据或者系统出发的;Fundamental表示,当要重新改造一个业务流程时,最重要的一个基本问题是:我们为什么要做?并且我们为什么要这样做;Radical表明再工程的流程必须从现有工作方式中得到全面的突破,BPR并不提倡慢慢地改进现有流程,而是发现一个全新的流程;Dramatic表示BPR的改变是全面的,如成本、服务和质量等方面。
显然,BPR是以流程为中心的,但是却不是数据驱动,它提倡跳出圈子去思考,而不是详细地去分析现有数据。过程挖掘可能可以帮助识别问题和提出改进方案,但是却不能提出跳出圈子的方法来。

商务智能BI和过程挖掘

商务智能的概念目前并没有统一,而过程挖掘在业务流程分析上的卓越表现和创新性,过程挖掘被认为是商务智能的一部分,并且将成为下一代商务智能工具。
需要注意的是,商务智能并不是真的智能,并且还没有提供任何过程挖掘的能力,它只是进行查询(query),并通过一些简单的可视化工具来报告查询结果。

复杂事件处理CEP与过程挖掘

过程挖掘可以补足CEP。CEP是从多个来源的数据中推断出更高层次事件的事件或模式,它的主要目标是识别有意义的事件(比如机会或者威胁),并能尽可能响应这些事件(比如能够迅速发出警报当某种事件组合出现时)。CEP可以用于过程挖掘中的预处理。

治理、风险管理和法规遵循GRC和过程挖掘

GRC是指组织在处理不确定性和法律法规的情况下实现其目标的能力。过程挖掘可以用于GRC,过程挖掘方法能更准确地对组织的核心流程进行一致性检验并推断信息的有效性和可靠性。

自动业务流程发现ABPD、业务流程智能BPI、工作流挖掘WM和过程挖掘

ABPD是Gartner提出的概念,经常并认为和过程发现是一个意思。
BPI可以说是PM的同义词(可能相比较之下更不强调流程模型);BPI也被理解为BI中专注于分析业务流程的分支。
WM可以说是PM的前身,提出的背景是当时其目标旨在自动配置一个WFM(工作流管理系统)。

大数据和过程挖掘

简单说,过程挖掘是大数据时代的一个产物。

猜你喜欢

转载自blog.csdn.net/hyhy12580/article/details/112138875