基于隐私保护关联规则挖掘算法的研究

基于隐私保护关联规则挖掘算法的研究

ID:33978954

大小:4.22 MB

页数:70页

时间:2019-03-02

基于隐私保护关联规则挖掘算法的研究_第1页
基于隐私保护关联规则挖掘算法的研究_第2页
基于隐私保护关联规则挖掘算法的研究_第3页
基于隐私保护关联规则挖掘算法的研究_第4页
基于隐私保护关联规则挖掘算法的研究_第5页
资源描述:

《基于隐私保护关联规则挖掘算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江苏大学硕士学位论文基于隐私保护的关联规则挖掘算法研究姓名:刘峰申请学位级别:硕士专业:计算机应用技术指导教师:薛安荣20120603江苏大学硕士学位论文摘要隐私保护是数据挖掘领域中一个重要的研究课题,其目标是在不泄露隐私信息的前提下,获得精确的挖掘结果。数据挖掘中的隐私保护通常有两种解决途径:安全多方计算和数据扰乱。分布环境下的关联规则挖掘在隐私保护方面己取得一定的研究成果,但其还存在着不足之处,现有的分布环境下关联规则挖掘主要使用的是安全多方计算方法,由于关联规则挖掘包含的一个重要过程是从候选频繁项集空间中通过计算找出支持数不小于给定阈值的频繁项集,而候选频繁项集是海量的,安全多方

2、计算采用安全协议管理这个过程,能够获取精确的结果,但计算每个候选项集的支持数都需要多次加/解密和多次通信,故算法效率低、通信量大;基于扰乱的隐私保护技术是集中式环境下的主要技术,能够快速的实现数据扰乱和重构,但由于对单个属性进行干扰,破坏了属性之间的相关性,导致挖掘精度下降,直接应用于分布式环境会存在安全性和精度不高问题。针对上述问题,本文的重点是研究一种综合考虑属性之间相关性的新型扰乱方法,并应用于分布式环境下结合安全多方计算尽量高效精确地完成分布式环境下的隐私保护关联规则挖掘。本文主要工作如下:(1)针对数据垂直分布环境下基于安全多方计算的效率低下问题,提出一种多属性扰乱技术与安全

3、多方计算相结合的方法。首先使用扰乱方法快速估算候选项集的全局支持数,再使用安全多方计算仅对支持数大于给定阈值的候选项集精确计算其全局支持数,从而减少了使用安全协议计算的项集的数目,提高了挖掘效率。使用多属性扰乱策略,能够保持属性之间的相关性。实验结果表明,本方法与安全多方计算相比,精度保持在92%的情况下,挖掘效率提高了680/,...90%。(2)针对数据水平分布环境下基于安全多方计算的效率低下以及传统扰乱方法精度不高问题,提出一种基于事务压缩与安全多方计算相结合的方法。主要思想是将原始联合数据集映射到一个较小的匿名数据集,该匿名数据集与原始联合数据集具有相似的分布特征,包括属性间的

4、相关性。先从匿名数据集中快速估算出全局候选项集的支持数,再使用安全多方计算仅对支持数大于给定阈值的候选项集精确计算其全局支持数,从而提高了挖掘效率。实验结果表明,该算法与江苏大学硕士学位论文安全多方计算相比,精度保持在90%以上的情况下,挖掘效率提高了70%~93%,相比传统扰乱方法,挖掘精度提高了16%之9%。(3)为了方便用户使用本文所提出的方法开发一些实际的应用,同时为了方便以后的学者测试本文算法,基于以上研究的理论基础,设计并实现了分布式隐私保护关联规则挖掘原型系统,并对系统进行了测试,测试结果表明系统运行良好,达到预期目标。关键字:数据挖掘,隐私保护,相关性,安全多方计算,数

5、据扰乱,事务压缩Il江苏大学硕士学位论文AbstractPrivacypreservingisaveryimportantresearchquestioninthefieldofdatamining.Thegoalistoobtainaccurateminingresultsbutnotdiscloseprivateinformation.Themethodsofprivacypreservingdatamininginc.1udesecuremulti-partycomputationanddatadistortion.Distributedenvironmentassociatio

6、nrulemininghasalreadyobtainedsomeachievementsonresearchofprivacypreserving,buttherestillexitssomeinsufficiency.Inthedistributedenvironment,algorithmsalwaysbasedonsecuremultipartycomputation,whichcanachieveamoreaccuracyresult.Animportantprocessofassociationruleminingistofindfrequentitemsetswhoses

7、upportnotlessthanagiventhresholdfromthecandidatespacebycalculating.Butcandidatefrequentitemsetsaremassive,securemultipartycomputationusesthesecurityprotocolstomanagethisprocess,calculateseachcandidateitemsets’supportrequirem

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。