中文摘要中文摘要摘要:如何合理的组织网站建设,如何更加人性化的给用户提供服务,是网站的建设者和维护者越来越关心的话题。根据用户的使用记录,即Web日志进行用户的行为分析可以为页面改造和网站整体架构调优提出建议和指导。本文介绍了数据挖掘的概念、数据挖掘的常用技术、Web挖掘的原理和分类、 w曲日志挖掘的目的和过程等理论知识以及Shell、Struts、Hibernate和Applet等技术知识。本文设计并实现了一个基于Web日志的用户行为分析系统。整个系统开发框架分为表现层、业务层、持久层和领域模型层,表现层使用Struts,业务层使用 Spring,持久层使用Hibernate。基于Web日志的用户行为分析系统分为获取数据、数据预处理、用户操作统计和页面属性统计四个模块。获取数据模块完成获取Apache日志和Tomcat日志; 数据预处理模块利用数据预处理模型对“脏数据”进行清理;用户操作统计模块实现用户操作序列查询、用户操作图查询和系统操作对查询的功能;页面属性统计模块实现页面转化率查询和页面出错率查询的功能。本文描述了基于Web日志的用户行为分析系统的一个运行实例,对用户操作序列、用户操作图、系统操作对,页面转化率和页面元素出错率进行分析,提出了页面改造和网站整体架构调优的建议,该网站采纳了这些建议后,增加了用户业务管理网站的注册流量,增加了公司收益。本文是第一次尝试利用Web日志对网站的操作元素进行分析与统计,从而总结出使用该网站用户群的操作习惯和操作方式,对进一步优化系统页面布局甚至调优整个网站的架构都能起到重要的指导意义。关键词:Web日志;数据挖掘;Web挖掘;日志挖掘;用户行为;页面布局分类号:TP393 ABSTRACT ABSTRACT:It ing apopular topic that thesite builders andmaintainers are caring about how anize thelogical structure ofWeb siteand how toprovide the service USer behaviors Cangive suggestions and guidance to optimize layout ofsome pages and the whole architecture ofWeb ording to usage record,thatis,Web log. This paper introduces some theoretical knowledge,such aS theconcept mon techniques ofdatamining,the principles and classification ofWeb mining,the purpose and process ofWeb log mining and some technical knowledge,such aSShell, Struts,Hibernate andApplet and SO on. Thispaper designs andimplements auser behavior analysis system has fourlayers,the presentation layer,the persistence layer,the business layer and the domain model presentation layer uses Struts,the persistence layer uses Hibernate andthebusiness layer uses Spring. nere are fourmodules inthesystem,dataacquirement module,data preprocessing module,USer actions statisticmodule and pages attribute acquirement module achieves togetApache logand Tomcat preprocesslng module mal(es use of adatapreprocessing model toclean thedirty actions statistic module implements the queries of user-action’sequence, user-dayaction
基于web日志用户行为分析 来自淘豆网m.daumloan.com转载请标明出处.