基于SPSS统计分析的文本特征值提取算法-论文.pdf

基于SPSS统计分析的文本特征值提取算法-论文.pdf

ID:58138297

大小:517.78 KB

页数:3页

时间:2020-04-24

基于SPSS统计分析的文本特征值提取算法-论文.pdf_第1页
基于SPSS统计分析的文本特征值提取算法-论文.pdf_第2页
基于SPSS统计分析的文本特征值提取算法-论文.pdf_第3页
资源描述:

《基于SPSS统计分析的文本特征值提取算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Vo1.42No.2计算机与数字工程总第292期220Computer&DigitalEngineering2014年第2期基于SPSS统计分析的文本特征值提取算法付敏戴祖旭(武汉工程大学理学院武汉430074)摘要在文本特征值的信息隐藏过程中,特征值是一个句子固有的属性,具有随机性。通过分析特征值之间的相关关系,找出其分布变化规律,才能控制其变化,以实现更好的信息隐藏。针对文本信息,首先在VC平台下设计出自动的特征值提取算法,然后利用SPSS统计软件统计分析了文本的特征值。实验结果表明该算法的统计分

2、析给出了有效的特征值数据。关键词文本特征值;信息隐藏;SPSS中图分类号TP309.7DOI:10.3969/j.issn1672—9722.2014.02.012AnEigenvalueExtractionMethodforChineseTextsBasedonSPSSFUMinDZuxu(DepartmentofScienceWuhanInstituteofTechnology,Wuhan430074)AbstractEigenvalueiSafixedcharacteristicOfasente

3、nceintheextractionfortextsanddistributesrandomly.Throughanalysisofkindsofeigenvalues’relationandtheirdistributionrules,informationhidingcanbeachieved.AstOex—ampletext,firstlyautomaticeigenvalueextractionalgorithmbasedonVCisconstructed,thenitseigenvaluei

4、sanalyzedusingstatisticalsoftwareSPSS.Thenumericalexperimentresultshowsthatthealgorithmcanprovideeffectiveeigenvaluedata.KeyWordstexteigenvalue,informationhiding,SPSSClassNumberTP309.7例如行间距编码法和字间距编码法l2;2)基于语1引言法的文本信息隐藏,其基本思想是将隐藏信息按照信息隐藏将机密信息隐藏于载体中进行传递,某

5、种规则替换成一些自然语言l_3;3)基于语义的其原理如生物学上的保护色,巧妙地将自己隐藏于文本信息隐藏,其基本原理是在将一段正常的语言环境中而免遭天敌攻击,这正是传统密码学技术所文字修改为另一段正常的语言文字的过程中将秘欠缺的。据隐藏载体不同,信息可在图像、视频、音密信息隐藏进去,为了提高隐蔽性,经常配合使用频及文本等媒体中隐藏。目前用于图像和视频方同义词替换法[4;4)基于文本特征值的信息隐藏,面的信息隐藏方法很多L1],并且很多方法都比较有比如根据文字字体、颜色、下划线等隐藏信息[5]。效,但这些

6、方法却不适用于文本。因为文本几乎不基于文本特征值的信息隐藏便是其中一种方包含任何冗余信息,因此在文本中隐藏信息更为困式,把特征值理解为一个句子固有的属性,分析文难。根据文本的特点,信息隐藏时须满足二个条本特征值之间的相互关系。由于特征值统计上是件:一是信息隐藏后不影响文本的可读性;二是不不独立的,所以携带秘密信息的主特征值的分布改在内容表征上产生能被视觉感知的异常。目前,流变后,其他特征值的分布也会改变L6]。因此如果知行的以下几种算法:1)基于格式的文本信息隐藏,道其他特征值的分布的变化规律,就能控

7、制其他特*收稿日期:2013年8月14日,修回日期:2013年9月24日基金项目:湖北省自然科学基金重点项目(编号:2010CDA009);湖北省自然科学基金一般项目(编号:2OO9CDB367);国家自然科学基金面上项目(编号:61175013)资助。作者简介:付敏,女,博士研究生,讲师,研究方向:信息处理和数字图像处理。戴祖旭,男,博士,教授,研究方向:信息安全,信息处理。222付敏等:基于SPSS统计分析的文本特征值提取算法第42卷的统计功能实现了对于特征值统计的数据分析,总结EJ].Compu

8、terEngineeringandApplications,2007,43出来名词的数量和总词数的分布近似线性关系,且名(14):16O一161,198.[6]戴祖旭,洪帆.基于词性标记文法的文本信息隐藏算法词和动词各频数的关系分布也近似呈现线性关系。EJ3.四川大学学报(工程科学版),2007,39(5):97—101.另一方面,系统在功能实现上对一些数据结构和DAIZuxu。HONGFan.TextInformationHidingA1一函数的设计不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。