微数据发布中提高匿名数据可用性的匿名化方法研究

微数据发布中提高匿名数据可用性的匿名化方法研究

ID:33620915

大小:3.39 MB

页数:60页

时间:2019-02-27

微数据发布中提高匿名数据可用性的匿名化方法研究_第1页
微数据发布中提高匿名数据可用性的匿名化方法研究_第2页
微数据发布中提高匿名数据可用性的匿名化方法研究_第3页
微数据发布中提高匿名数据可用性的匿名化方法研究_第4页
微数据发布中提高匿名数据可用性的匿名化方法研究_第5页
资源描述:

《微数据发布中提高匿名数据可用性的匿名化方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据ResearchonAnonymityMethodstoImprovetheDataUtilityofAnonymousDataforMicrodataPublishingThesisSubmittedtoZhejiangNormalUniversityinpartialfulfillmentoftherequirementforthedegreeofMasterofEngineeringMaYeling(ComputerSoftware&Theory)ThesisSupervisor:WangJ

2、iyiHanJianminMay,2014万方数据微数据发布中提高匿名数据可用性的匿名化方法研究摘要llIIlllllllllllllllllqlllllUllllqllllllqlLlllllY2664102微数据在数据分析和科学研究等领域发挥着越来越重要的作用。因此,越来越多的组织机构收集并共享微数据,然而微数据的发布和共享会泄漏包含在数据中的隐私信息。因此,微数据发布中隐私保护问题近几年来成为数据挖掘领域的研究热点。目前在微数据发布的隐私保护领域中,匿名化技术是该领域中的主流方法,其主要思想是通过对

3、原始待发布数据的处理,减少个体身份被攻击者唯一标识的概率,从而实现个体的隐私保护。本文通过结合噪音技术、模糊粗糙集等领域知识,对微数据发布中隐私保护在匿名数据可用性上进行了研究,主要工作如下:(1)提出了将泛化和噪音技术相结合的隐私保护匿名化方法的研究。在现有的实现缸匿名模型的隐私保护方法中,泛化技术的应用相当广泛。尤其是在数据分布均匀的状况下,其数据匿名效果较好。但当数据规模不是很大,分布不均匀的情况下,会出现数据泛化程度过大,匿名数据可用性过低的问题。针对这个缺陷,本文提出了噪音和泛化技术相结合的GN

4、匿名方法,该方法通过在泛化过程中添加噪音降低泛化程度;并提出噪音添加模型,保证添加噪音后的匿名数据中敏感属性分布与原始数据基本不变;还提出了实现算法GN-Bottom.up算法,且实验证明GN方法比原始一般匿名方法能有效降低泛化的程度,提高数据的可用性。(2)提出了基于模糊粗糙集的加权聚类隐私保护方法的研究。在现有隐私保护方法产生的匿名数据中,普遍存在针对聚类应用的可用性差问题。针对该问题,本文提出一种考虑属性权重的隐私保护方法(FSRS)。其中通过基于模糊粗糙集的客观权重分配方法,得到属性权重以更好进行

5、聚类泛化,达到提高数据聚类应用的目的。本文还通过Weka中聚类效果分析验证该方法的有效性。(3)提出了基于粗糙集理论的匿名化方法的研究。在工作点二的研究基础上,本文提出了一种改进后考虑属性权重的隐私保护方法(PBRS)。其中各个属性的权重由粗糙集中系统属性重要度定义的方法获得。本文也通过Weka中聚类效果分析万方数据摘要验证该方法的有效性。关键字:隐私保护:肛匿名;噪音;模糊粗糙集;泛化Ⅱ万方数据RESEARCHONANONYMITYM匝THODSTOIMPROVE唧DAI'AUTILITYOFANONY

6、MOUSDATAFORMICODAl-~PUBLISHINGABSTRACTMicrodataplayanincreasinglyimportantroleindataanalysisandscientificresearch.Therefore,manyorganizationsarecollectingandsharingmicrodata.However,publishingandsharingmicrodatawillputrisksonindividual’Sprivacy.Duetothisp

7、roblem,privacypreservationforpublishingmicrodatahasbecomeahottopicintheareaofdatamining.Atpresent,theanonymousmethod,foritssecurityandeffectiveness,becomesthehotspotamongtheorientedmicrodataprivacyprotectionmethods.Theanonymousmethodisanapproachofdataprep

8、rocessing,whosegoalistoreducetheprobabilitythatanattackeruniquelyidentifiestheindividualidentityinformation,SOastoprotecttheprivacyofindividuals.Incombinationwiththeknowledgeofnoisetechnologiesandfuzzyroughsets,this

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。