Inductive visual Miner(IvM)

Inductive visual Miner

归纳视觉挖掘器(IvM)[5]将业务流程发现一致性检查结合在一起,为用户提供了易于使用的流程挖掘探索工具。

给定事件日志,Inductive Visual Miner会自动发现一个过程模型,将该模型与事件日志进行比较,并可视化一些增强功能,例如性能度量,队列长度和动画。所有步骤都是自动化的:如果您更改任何参数或更改任何过滤器,IvM都会自动更新所有必要的内容。

可以通过将事件日志加载到ProM并应用插件“mine with Inductive visual miner”来启动IvM。或者,如果您已经有一个流程树,并且想要将其与事件日志进行比较,请使用插件“ Visualise2”。

流程树上的偏差”可在没有挖掘控件和选项的情况下启动IvM,但具有路线,偏差,动画和突出显示过滤器。

过程树

六种节点:
1.在这里插入图片描述

  • xor表示其子孙之一需要被执行。例如,图1流程树表示必须执行“支票索赔”或“支付”。

2.在这里插入图片描述

  • sequence表示其所有子级都需要按顺序执行。例如,图2表示首先是“ check claim”,然后是必须执行’pay’。

3.在这里插入图片描述

  • interleaved表示需要执行其所有子项,但是这些执行不能在时间上重叠。例如,图3表示必须执行“check claim或“pay”,但必须先完成,然后才能开始另一个。

4.在这里插入图片描述

  • concurrent表示其所有子代都需要执行,并且它们可能在时间上重叠。例如,图4流程树表示“支票索赔”或“支付”必须彼此独立执行。

5.在这里插入图片描述

  • or表示至少需要执行其子项之一。如果执行了多个子代,则它们在时间上可能会重叠。例如,图4表示必须执行“支票索赔”或“支付”或两者都执行。如果同时执行了“支票索赔”和“付款”,那么这些执行是独立的。属于inclusive choice

6.在这里插入图片描述

  • loop表示必须执行第一个孩子。执行完第一个子项后,可以选择终止还是再次执行第二个子项,然后再执行第一个子项,然后再次做出相同的选择。例如,图6流程树表示始终执行“check claim”。之后,可能会重复执行“pay”后跟“check claim”

在这里插入图片描述

控制器及参数

在这里插入图片描述

活动滑块

活动滑块控制应用了发现算法的事件日志中包含的活动部分。也就是说,在发现之前,将对事件日志进行过滤。滑块的位置(介于0和1之间)确定显示许多活动保留在过滤后的事件日志中。例如,日志[<a,b,c>,<a,b>,< a >]具有频率表[a3,b2,c],如果将活动滑块设置为0.4,则所有事件对应发生的活动超过发生次数最多的活动的0.4倍。在示例中,过滤后的事件日志将为[<a,b> 2,< a >],并且向此过滤后的事件日志应用发现算法。

其实就是删除活动不足的事件。

请注意,这只会影响发现,即IvM的所有其他部分(包括对齐方式和动画)均不受此滑块的影响,将其和``paths’'滑块(如下所述)一直设置到1.0,并将miner选择器设置为IMf guarantees fitness。但是,如果事件日志除了包含完整的生命周期过渡,可能还会显示偏差。

路径滑块

路径滑块控制应用的噪声过滤的数量:如果设置为1,则不应用噪声过滤;设置为0时,将应用最大噪声过滤。从技术上讲,滑块将发现算法的输入设置为1-滑块。默认值为0.8,对应于1-f = 0.2的IMf,IMflc 和IMfa噪声过滤。将两个滑块一直推至1.0,并将miner 选择器设置为IMf guarantees Fitness。但是,IvM的对齐方式始终考虑到生命周期信息,因此可能仍然存在偏差。

分类选择器

分类器选择器控制决定事件活动的因素:XES日志中的事件可以具有多个数据属性[3],而该选择器确定这些数据属性中的哪一个确定活动的类型。可以使用复选框选择事件属性的任何组合。

挖掘前过滤开关

挖掘前过滤器开关打开一个面板以设置开采前过滤器。开采前过滤器不会更改对齐方式,性能指标或动画,但会过滤用于发现模型的日志。要激活预过滤器,请选中其复选框。例如,预过滤器“跟踪过滤器”允许仅使用花费超过10,000的客户来发现模型。

挖掘器选择

挖掘器选择器允许选择要使用的挖掘算法缺省为IMf,其他包含的选项为生命周期算法IMflc,IMfa,dirrectly-follows miner。我们限制了用户的选择范围:在[4]的评估中,这些算法被证明最适用于现实事件日志

编辑模型

编辑模型开关将打开一个面板,以手动编辑发现的模型,如下所述。如果结果不令人满意,这使用户可以纠正发现算法,并在同一事件日志上尝试使用不同的自定义模型的效果。

在这里插入图片描述

可视化模式选择器

  • paths:默认模式,显示模型;活动和边上的数字表示每个活动的执行总数
  • 路径和偏差显示模型:活动中的数字表示每个活动的执行总数。此外,红色虚线边缘表示对齐的结果:图6b显示了模型移动,表明活动记录在事件日志中被跳过了一次,而模型则说它应该已经执行了。图6c显示了一个日志移动,该日志移动指示在执行活动b之后事件日志中有9次事件在事件日志中发生,而根据模型该事件不应发生。
  • 路径和队列长度:显示了模型,并表示每个活动都在其前面的队列长度,即等待此活动开始的案例数。如果事件日志包含带有入队和开始生命周期信息的两个事件,则此队列长度是准确的。否则,使用[6]中描述的方法进行估计。随着动画的进行,此队列大小将更新。
  • 路径和停留时间:显示模型,并使用该活动的平均停留时间来表示每个活动。使用完成事件来计算停留时间。不估算停留时间,即,如果没有同时出现两个必需的完成事件并且没有时间戳,则将活动实例从平均值中排除。也可以通过将鼠标光标放在活动上来检查绩效指标:弹出窗口将显示绩效指标和直方图。应用任何日志过滤后,性能指标会自动更新
  • 路径和服务时间:显示模型,并以每个活动的平均服务时间来表示每个活动。使用开始和完成事件计算服务时间。服务时间未估算,即如果对于一个活动实例,启动事件和完成事件都不同时存在并且没有时间戳,则该活动实例不被视为平均值。

ctrl+dkeyi 改变模型方向

猜你喜欢

转载自blog.csdn.net/weixin_42253964/article/details/108578829