中山大学
硕士学位论文
姓名:何学迅
申请学位级别:硕士
专业:计算机技术
指导教师:姜云飞
20061128
摘要快速消费品行业的数据挖掘智能系统的设计与开发关键词:数据挖掘,快速消费品,关联分析、聚集分析、神经网络“竞争激烈;消费者忠诚度低;市场及销售成本过大;分销渠道复杂”是中国快速消费品厂家所面对的相同问题。在传统的业务管理系统中,记录的只是大量的、务数据,但企业的管理者无法发现数据问的内在联系和知识,导致了“数据爆炸但知识贫乏”的现象。随着信息技术的发展,数据挖掘汲晌F笠信息化管理的新热点。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,并日可以根掘预测未来趋势及行为,做出前瞻性的、基于知识的决策。集分析、神经网络等模型,探讨数据挖掘在快速消费品中的市场定位和细分、陈列标准优化、市场预测等方面的应用,并给出详细的算法。最后结合一些化妆品及食品的实际案例,说明数据的系统的实施设计方案,并对数据挖掘的知识进行评估和分析。指导教师计算机技术本文通过概述数据挖掘和快速消费品的行业特点,结合数据挖掘中关联分析、聚专业硕士生何学迅姜云淌
篊:,猰琁:現,:,,“琹琹琧盿痵.“瑃.’.琯,.,
第一章引言课题的背景随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在联系,从而促进信息的传递。现在数据挖掘技术在商业应用中已经可以马上投入使用,因为对这种技术进行支持的三种基础技术已经发展成熟,他们是:★海量数据搜集强大的多处理器计算机★数据挖掘算法从商业数据到商业信息的进化过程中,每一步前进都是建立在上一步的基础上的。见下表。表中我们可以看到,第四步进化是革命性的,因为从用户的角度来看,这一阶段的数据库技术已经可以快速地回答商业上的很多问题了。女
课题的研究内容本课题通过对数据挖掘和业务智能技术的研究,分析快速销售品行业的业务特点和需求特点,探讨各种数据仓库技术、设计思路以及各种机器学习、数据挖掘算法应用,从而为分析快速销售品行业提供业务智能、分析决策的支持:根据典型的业务场景,构建数据挖掘模型。数据挖掘在获取数据的假说的意义上,力图理解数据提供了什么;但是数据挖掘并不仅仅提出关于数据的假说,而且使得假说的可靠性的理性评估成为可能,并考虑假说很可能在何种真实环境范围内成立【俊1究翁獯咏⒁滴癯【挖掘主题龇ⅲ研究各种经典数据挖掘算法模型在快速消费品各个领域的应用以及效率、准确性等分探讨快速消费品行业的数据挖掘应用模式。数据挖掘蛘咧J斗⑾就是从大量的数据中抽取以前未知并具有潜在可用的模式,它是人工智能技术与数据库技术的结合,其核心是领域的机器学习。数据挖掘的关键技术是模式识别和关系识别的算法,许多算法来源于人工智能和机器学习等研究领域,本课题从数据挖掘和行业应用特点的角度出发,探讨机器学习斯ぶ悄在快速消费品行业中的应用模式。进化阶段商业问题“过去五年中我的总收计算机、磁带和磁、其他初关系数据库耸甏年二爿的销售额是多史性的、动态数据在记录级提供历据库、数据仓库信息提供预测性的信会怎么样J裁”器计算机、海量数析。支持技术产品产品特点数据搜集甏入是多少盘刨公司数据访问“在新英格兰的分部去峁够少查询语言联机分析处理年二月的销售额是多、多维数少ㄊ慷倬荽丝傻贸什么结论数据挖掘“卜个月波士顿的销售高级算法、多处理诹息行据库创公司、、瓹、.
课题的主要工作课题的实践情况分析各种数据仓库的应用架构,建立一些典型适用于快速消费品行业的数据仓库模型。实现具有一定通用性的数据挖掘算法的工具集。研究各种数据挖掘的算法,分析其优缺点、时间空间消耗、使用性、准确性等。探索利用机器学习实现商业智能的有效流程和方法。随着中国的经济的迅速发展,中国的消费品行业出现了前所未有的繁荣景象,繁荣的形式下又带来的激烈的企业竞争。近年来,许多企业通过实施了ソ饩錾调度、供应链、财务等企业的管理难题。但随着市场细分、以客户为导向、关注终端等经营思想出现,传统的以业务处理为主的信息系统不能
快速消费品行业的数据挖掘智能系统FMCGDM1.0的设计与开发 来自淘豆网m.daumloan.com转载请标明出处.