半监督排序的若干关键问题研究

半监督排序的若干关键问题研究

ID:34097070

大小:1.95 MB

页数:116页

时间:2019-03-03

半监督排序的若干关键问题研究_第1页
半监督排序的若干关键问题研究_第2页
半监督排序的若干关键问题研究_第3页
半监督排序的若干关键问题研究_第4页
半监督排序的若干关键问题研究_第5页
资源描述:

《半监督排序的若干关键问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学号D200877398学校代码10487密级博士学位论文半监督排序的若干关键问题研究学位申请人:潘志斌学科专业:通信与信息系统指导教师:尤新革教授答辩日期:2014年5月23日万方数据ADissertationSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofDoctorofPhilosophyinEngineeringOnSomeKeyProblemsinSemi-SupervisedRankingPh.D.Candidate:PanZhibinMajor:CommunicationandInfor

2、ma-tionSystemSupervisor:Prof.YouXingeHuazhongUniversityofScience&TechnologyWuhan,Hubei430074,P.R.ChinaMay23,2014万方数据独创性声明本人声明所呈交的学位论文是我个人在导师的指导下进行的研究工作及取得的研究成果。尽我所知,除文中已标明引用的内容外,本论文不包含任何其他人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完

3、全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密,在年解密后适用本授权书。本论文属于不保密。√(请在以上方框内打“”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日万方数据华中科技大学博士学位论文摘要排序是信息检索领域的核心问题,在众多应用问题如搜索引擎、协同过滤、药物发现与生物信息学中发挥着越来越重要的作用。排序旨在根据给定的训练样本,返回一个反映样

4、本序关系的列表。由于当前机器学习领域中支持向量机算法获得的巨大成功,学习已经成为解决排序问题的最重要的方法,排序学习成为了机器学习领域中继分类与回归之后涌现出来的学习问题与研究热点。然而,目前对排序学习的研究主要集中在监督情形。而在现实应用问题中,未标记样本的获取比标记样本更廉价也更容易,我们往往面对的是少量标记样本和大量未标记样本共存的情形――即半监督排序学习问题。因此本论文围绕半监督排序中的特征提取与模型设计分析两个环节展开研究,主要贡献如下:1.针对当前半监督排序模型没有考虑样本标记的值或样本标记的差分模度这一问题,提出了两个半监督排序模型:(a)基于图的直推排序模型。

5、我们基于图相似性矩阵建立了半监督排序模型,导出了闭式解,用其可得到未标记样本的评分。(b)基于图的保留模度半监督排序模型。利用最小二乘排序损失,我们证明了表示定理并推导出了该模型的闭式解,给出了推广误差的上界,证明了其推广性能与图的相似性矩阵之间有密切的关系。在推荐任务与量化构效关系分析中的实验结果表明,该算法比许多主流的排序学习算法具有更好的性能。2.针对当前半监督排序中可使用的核函数类型较少并且没有考虑非线性特征的正交性这一问题,构建了两种不同的用于向量型输入的Legendre核函数:(a)基于正交Legendre多项式的正交Legendre核函数。(b)基于广义Lege

6、ndre多项式的广义Legendre核函数。这些核函数确定的非线性映射的各个分量之间是彼此正交的,因此可以去除数据中的冗余。在一些公共数据集上的实验结果表明,与已有的Chebyshev正交多项式核函数相比,使用了广义Legendre核函数的支持向量机算法往往具有较少的支持向量、较高的稳定性与更好的推广性能。3.针对可应用于半监督排序的常用特征提取方法――线性判别分析在现实应用中碰到的小样本容量问题,提出了两种线性判别分析准则:(a)加权和判别分析准则。该准则中同时考虑了两种不同度量――类内散度与类间相似性,其优化模型的解最终归结为一个特征分解问题。因此加权和判别分析准则可以克

7、服小样本容量问题、提取出任意数量的特征,并在一些标准人脸数据集上获得了较高的识别精度。(b)值域空间线性判别分析。它是一种两阶段判别准则,在第一阶段中将所有样本投影到类间散度矩阵的值域空间中,然后再实施传统的线性判别分析。与一些主流判别分析准则相比,该准则的识别精度具有可比性且计算效率较高。I万方数据华中科技大学博士学位论文关键词:排序学习,半监督排序,基于图的保模半监督排序,广义Legendre核,加权和判别分析II万方数据华中科技大学博士学位论文AbstractRankingisthecentral

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。