web数据挖掘在网站优化中的应用

web数据挖掘在网站优化中的应用

ID:33289720

大小:1.65 MB

页数:48页

时间:2019-02-23

web数据挖掘在网站优化中的应用_第1页
web数据挖掘在网站优化中的应用_第2页
web数据挖掘在网站优化中的应用_第3页
web数据挖掘在网站优化中的应用_第4页
web数据挖掘在网站优化中的应用_第5页
资源描述:

《web数据挖掘在网站优化中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、r771071组旦大学学校代码l10246学号l033021109硕士学位论文鼢数据挖掘在两站绋化中的应用院系(所):软件学院专姓业。软件工程名:王祥始辱夔帮;朱扬勇宪麓·皆期。2∞婢11rBlol目摘要随着Web技术的发展,rH子商务网站风起云涌,几乎所有企业都有了自己f内酬站。侣建立起一个电子商务网站并不附雉,嗣难的是如何汁您的网站有收蕊。女l』f『U能有效的使用这些网站,使之为企业带来利润却不容易。凶之,如何使自已的网站快速、高效的运作,以使其效率、效益最大化已成为各大网站迫在眉睫的紧要仃务。刈此我们从网站结构调整的角度出发,考虑如何对Web网站的站点结构进行快速、合理的优化改造,以

2、使其结构f_1趋合理,效率H益提升,使之能真正成为帮助企)lkJI:拓业务、增加效益、提高运行效率的商业平台,以确保企业存激烈fm}i场竞争中,保持并增加自身的竞争能力和竞争优势。Web挖掘是一项和Web发展紧密相关的数据挖掘技术。本文诗‘先概括了数搠挖掘、wel)挖掘的研究状况,然后讲述了三方嘲实践1.作:站点优化的力法改怨;快速优化的编程算法,以及对优化网站的效果检验。在本文ch我们对用户的使用行为数据⋯.页面访问量进行了分析,以将其应用到刚站的自动优化设汁叶·。木文从网站的设计和使用角度出发,对如何进行Wcb刚站的优化设计提}:【j』,n己的想法。为了提高商务网站的访问效率,本文以‘

3、应尽川‘能减少恻站层次结构’fn心恕为⋯发点,进行了一定的分析、对比和思考,提出了⋯个‘页面职责’的说法,认为任们‘张恻站页面都应具有两种价值:信息提供价值和I镀接跳转价值。虽然我们对刚站页面可以分为i类(首页、-㈨lJ页、叶页),帽锌类的豇帕f价1.

4、!【也齐有侧重,但都应对上述两种价值有所实现。凼此,我们以此为掂,将葵作为理论址fllllj{二刘站点页面进行考察,从呶【:0_i实现价值的程度H{发,分析、对比、m渊,咀决定足否要对具体的页面进行调整——提升、合并或删除。m总结分析了现有Web挖掘算法的f要思路和实际应用后,闸述了种wc、h刚站优化的新思路:并灵活运用了一种幽沦中无I以带

5、权图生成树的算法,舟做j’一定改进后使之成为网站优化的程序实现。本文的三个主要内容是:1)阐述了一种计算方法以度量页面的使用效率:通过对网站页面的访问出入数和出入度的比值的比较,以确定页面是否尽责;2)设计了”~种优化网站的算法,以迪杰斯特拉7卜成树算:法为皋础;3)以X?校验方法对优化后的网站结构进行榆验,阻确定优化是否成功。在文中我们通过对Web站点页而访问数的计算、分析,建立了一套度量标准,并以之考察、衡量网站中页面的使用效率,再以此做为优化网站的依据。我们用以度量页面是否尽责的标准是:通过对页面访问量和页面出入度的比值进行计算和分析。从页面使用效率的角度(非语义角度)来考虑页面是否

6、具备了较强的表达能力,由三个指标组成,具体如下:·页面吸引力:同层节点间进行价值比较的依据;·页面信息满足率:衡量页面本身提供信息能力强弱的参数;·页面依存度:度量上下层页面位置是否合理的指标。我们希望这种方法能对网站优化或日网站白适应调整有所应用。因为,虽然IIl订有很多用j:搜索引擎的Web链接算法,蜘IPageRank、HITS等,但本文所述的算法勺它们有所不同,主要是考察对象不同。现有的链接算法大多从事件出发,以事件为集合,从路径着手:丽本文的出发点则是以信息的载体⋯一页面为集合,从页面本身的信息表达能力入手。通过肘每张页面足否尽责的判别,来确定整个网站的结构足甭合删。同时我们还建

7、议为了提高网站的优化速度,对网站进行优化改造时,以分段组装的方式进行,即先对局部节点进行分块优化,然后再整合组装为一个整体,f们不是H前通常的作法:将整个刚站作为一个整体进行优化。建议将网站优化利枪索特定用户访问模式作为两种功能分丌进行。本文构造算法是以无向带权连通图的£Ii成树为基础,是一种贪心算法的应川。L一另两种最小生成树的著名算法Krusk;t1干¨Prim算法相比,本文算法的优点足不需要对所用到的边集数组进行排序,可从任意节点出发,,H任意边J,创建‘株生成树,故比时两种算法更实用。本钾法最先IlIDiiksrt;l提出。仍存本文t}}有一些修改,}要是用以生成树的权值夼洱是最短

8、边,而赴厶壶人访刚醚,敞{=勾建出的是最大页面防问树,而1i是最d,fl-:成树。小文中将推论统计学结合到Web数掘挖掘中,将其应用到剥访问频率数捌的统计分析。侧重于对Web站点的页而访问数量的观察,所用的是统计检验方法中的单向x2统计检验。在Web挖掘领域中,进行统计分析的关键是界定各种反}畎用户行为信息的量化指标,各种访问流量指标对常见fr,j站点优化设计很有协助,我们只使用了其中的一叫、部分。虽然,用户在刚站上儿乎

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。