基于日志的流程挖掘算法分析

基于日志的流程挖掘算法分析

ID:33397813

大小:3.52 MB

页数:38页

时间:2019-02-25

基于日志的流程挖掘算法分析_第1页
基于日志的流程挖掘算法分析_第2页
基于日志的流程挖掘算法分析_第3页
基于日志的流程挖掘算法分析_第4页
基于日志的流程挖掘算法分析_第5页
资源描述:

《基于日志的流程挖掘算法分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、山东大学硕士学位论文第1章绪论随着工作流技术的发展和工作流管理系统功能的完善,对工作流技术的研究也正在向更深层次发展。工作流技术的研究目前有两个方向【l】:一是工作流管理系统实现理论的研究,即针对工作流模型和语义的形式化表示方法、工作流模型的验证与分析等工作;另一方向是探讨如何利用先进的技术来提高工作流管理系统的性能,这方面的研究方向主要有:模型仿真技术、运行时的监控与事务处理、异常处理和错误恢复、企业业务系统的集成、流程运行数据挖掘等。本文研究的主要内容是属于后者中的流程运行数据挖掘。概括地说,流程挖掘就是:假设日志中记录了流程实例的实际活动执行次序

2、,我们根据日志中记录的这些信息,来重构出一个工作流模型,并使得日志中记录的任一实例都符合这个工作流模型中的一个轨迹[21。本文就是试图寻求一种从流程日志中挖掘工作流模型的方法。1.1课题提出的背景和意义在最近的十年中,工作流管理的概念和技术已经广泛应用到企业信息系统中。工作流管理系统如Staffware,IBMMQSeries,COSA,等都有为结构化业务流程给出通用建模和定制的能力[2K6]。通过实施图形化的流程定义,即描述典型案例的生命周期模型,用户能够配置这些系统以支持业务流程。除了纯粹的工作流系统,许多其他的软件系统也采取了工作流技术。比如企业

3、资源管理规划(ERP)系统,像SAP,PeopleSoft,Baan和Oracle,客户关系管理系统(CRM)软件,供应链管理(SCM)系统,B2B应用等等,都嵌入了工作流技术旧。尽管许多系统给予了承诺,但当真正应用工作流技术时仍会遇到许多的问题。一个问题是这些系统都需要工作流的设计,即设计器需要建立详细的描述工作路由的精确模型。工作流建模绝不是一件简单的工作:它需要深厚的工作流知识和与操作人员详细和深入的交流。另一个问题是为存在的流程建模往往受主观的影响,比如模型常被标准化成为应该做什么而没有真实的描述实际的流程。结果,创建的模型往往变得非常主观【2

4、】。一种更客观的建模方法是使用与实际发生的事件相关联的数据(注意到流程第l页山东大学硕士学位论文挖掘不受主观和惯性思维的影响),这就是基于日志的流程挖掘技术。流程日志的作用是相当大的,它真实地记录了工作流管理系统的运行情况,基于日志的建模比事前仿真在某些方面更有说服力。流程挖掘的另一个重要意义在于,通常在理想的情况下,描述业务流程的工作流模型总是被预先用建模工具加以定义,然后部署到工作流引擎之上加以执行;当业务规则发生变化的时候,重新设计工作流模型。但是在某些情况下,可能原有的工作流模型不存在或者某些局部分支丢失,存在的只是业务执行过程中留下了的大量的

5、执行实例和产生的轨迹。这时使用日志进行挖掘来重建工作流模型,便是一个快捷有效的方法。另外流程挖掘可用于做Delta分析,即将挖掘出来的流程模型和原先部署在引擎之上的流程模型进行比较,分析原有的模型中存在哪些问题,以便进行改进。流程挖掘导致一个“运行后一流程模型可用来与“运行前"流程模型进行比较。流程挖掘这个题目与业务流程重组(BPR),业务智能(BI),业务流程分析(BPA),持续流程改进(CPI)和知识管理(1(M)相关联。流程挖掘可以被看作BI,BPA和脚趋势的一部分。而且,流程挖掘可以被看作BPR和CPI活动的输入。应该注意的是流程挖掘被用在BP

6、R上比CPI更适合。回想BPR元素的一个基本特征是它很激进并且不受目前状况的限制。也应注意到流程挖掘不是一个重新设计流程的工具。它的目标是获得流程真正完成的任务。尽管流程挖掘不是设计流程的工具,但对已存在的流程进行深入理解和掌握是对重新设计流程非常重要的。我们认为有必要在流程挖掘方面进行我们的研究课题,提出可行的解决办法。其中结构化挖掘方法就是我们的研究成果之一,它很好的解决了从日志中发掘出合理、安全、容易理解的工作流模型。1.2国内外研究进展情况流程挖掘是BPM(BusinessProcessManagement)【6】的一部分,其思想直到最近才被提

7、出来。在这方面的研究有代表性的有:从流程日志中挖掘出工作流模型【36】:通过对工作流执行历史数据进行分析来确定工作流模型参数及系统瓶颈【37】;通过数据仓库和联机分析处理技术的工作流执行数据分析郾】等。Cook和Wolf在软件工程流程领域已经研究了相关问题。在[15]中他们描述了流程发现第2页山东大学硕士学位论文的三种方法:一种是使用神经网络,一种是使用纯数学方法,一种是Markovian方法。纯数学方法建立了一个有限状态机(FSM),Markovian方法使用算法与统计方法的混合,能够处理干扰。Cook和Wolf扩展了他们的工作到并行流程。他们提交了

8、指定的测量项(事件类型读数,周期,因果关系)并用这些测量项从事件流中发现方法。然而,他们没有提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。