基于web日志的用户行为分析

ID：32725855

大小：16.09 MB

页数：66页

时间：2019-02-15

资源描述：

《基于web日志的用户行为分析》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、1．1研究背景1综述本论文是通过对某公司一个典型的用户业务管理网站的同志进行研究与分析，设计一个基于Web同志的用户行为分析系统，用于发现和总结不同属性用户的操作行为，查找页面存在的问题，指导页面的布局改造，提升网站的注册流量，增加公司的收益。Web自从出现以来，就以惊人地速度发展着。要准确知道Web的总大小并非易事，据估计，它目前已超过了2x109个页面，并以每天lxl06个页面的速度增长¨J。早期的w曲是以信息共享为主的，近年来，电子商务、电子图书馆、远程教育等已成为Web的主要应用，促使Web

2、以更快的速度发展，同时也对Web站点的设计和功能提出了更高的要求：要求Web具有智能性，能快速、准确地找到用户所需信息；能为不同用户提供不同的服务；能允许用户根据自己的需要定制页面；能为用户提供产品营销策略信息等掣21。随着互联网技术和www技术的迅速发展，如何合理的组织网站建设，如何更加人性化的给用户提供服务，如何从海量的网络信息中迅速地找到用户最为关注的信息，成为大家越来越关心的话题。Web本身具有无集中控制，无统一结构，无完整性约束，无事务管理，无标准查询语言和数据模型、可无限扩展松散的分布式

3、特点，这使得基于Web的知识发现愈加困难，获取的知识经常是不准确的甚至是不可靠的【31。更由于此，使得Web的组织结构便变得没有规律，网站的设计也没有依据可循。但是，人们发现，根据WebServer服务器的配置，每当用户访问Web站点时，便将这次的访问信息都记录到一个日志文件中，这些信息即所谓的点击流数据。Web日志中记录了用户的所有访问情况，如所访问的页面、时间、用户ID、用户IP、请求页面大小、访问的页面浏览器等。可见，Web日志有着相对清晰的结构。于是可以通过分析不同的Web站点和Web访问同

4、志，从中挖掘出潜在的、有效的知识如：发现用户浏览站点的共同行为等，就可以帮助人们理解用户行为和Web的结构，并使得设计的Web站点更加智能化，并为用户提供个性化的“主动服务”【4】o于是，WebR志挖掘的研究成为一种需求，国内外越来越多的学者开始对Web日志挖掘进行研究。北京交通人学硕：}=学位论文1．2研究意义研究Web日志挖掘的主要目的就是从挖掘结果中分析出用户最为关心的问题，并通过分析被访问资源的重要性和相互之间的关系，对网站的结构和设计进行修改，以期望留住更多的客户，更好的为客户服务。真正做

5、到“主动服务"和“智能化”，即不需要用户做什么而自动地把用户感兴趣的信息提供给他，并且网站能够根据用户的访问频率，访问时间以及访问爱好等来动态的调整页面结构，改进服务，从而展开有针对性的电子商务活动，以更好的满足用户需求。所以，对Web同志挖掘的研究可以通过学习用户的访问模式，更好的理解用户的访问意图，自动的改进Web站点信息的组织与显示，具有很强的现实意义。而对于本项目来说，因为R志针对的是一个典型的用户业务管理网站，这个网站上用户的活动将对网站产生盈利，通过总结用户的使用习惯，操作规律，统计网站

6、的页面转化率，注册页面的出错率等，对改进网站的页面布局，进而优化网站的总体架构，具有借鉴和指导意义，对于公司来说是一种积极的营销模式，具有很强的实用价值。1．3研究现状数据挖掘从20世纪80年代出现以来，有许多关于它的宣传，尤其是许多人希望数据挖掘成为一种从数据中挖掘知识的工具，使它能帮助企业经理提出作战决策，促进商业竞争，或者做其它更多有趣的事情。Web挖掘是指使用数据挖掘技术从大量的人为构造的wwW上挖掘有趣的、潜在的、有用的模式及隐藏信息的过程。Web挖掘按照应用分为3种：W曲内容挖掘(W曲C

7、ontentMining)、Web结构挖掘(w曲StructureMining)和W曲应用挖掘(WebUsageMining)【51。其中Web内容挖掘是用来提取文字、图片、音频、视频或其他网页内容成分的信息；Web结构挖掘是用来提取网络的拓扑信息，即挖掘网页之间的链接结构和网页的内部结构；Web应用挖掘是用来提取客户如何运用浏览器浏览和使用网站链接的信息，也就是从网络同志中提取用户感兴趣的模式。目前，基于Web同志的数据挖掘研究大致分为3类：以分析系统性能为目标，以改进系统设计为目标，以理解用户意

8、图为目标【6】。由于目标的不同，所采用的技术有所不同，以分析系统性能为目标的Web数据挖掘的研究多采用统计学的方法，以改进系统设计为目标的数据挖掘多采用关联规则挖掘的方法，以理解用户意图为目标的数据挖掘研究多采用聚类挖掘和分类挖掘的方法。2综述迄今为止，Web同志的挖掘的方法主要有两大类：一类是基于Web事务的方法。即将数据挖掘技术应用于Web服务器日志，以期发现用户浏览模式。这类方法提出了最大前项引用序列MFR的概念，并用它将用户会话分割成一系列的事务，然后才用与关

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 66



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于web日志的用户行为分析

基于web日志的用户行为分析

相关文章

相关标签