下载此文档

数据挖掘解决方案.docx


文档分类:IT计算机 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
Android应用商店——数据挖掘解决方案
一、问题背景
Android是Google于2007年11月05日宣布的基于Linux平台的开源移动系统,Android有别于以往的手机及移动终端操作系统,它独特的开源和开放性,获得了广大开放社群的认可,并为其提供稳定且持续更新的支持;同时它又和移动互联网紧密相连,使得开发人员更加容易把互联网应用移植过来;此外,它还让厂商、运营商、甚至用户本人都能很方便的进行全方位的定制或配置。所以在这短短几年里Android的发展势头是相当惊人的。随之发展当然就是Android应用程序的不断发展。在这里我们就要讲到本文的主题Android应用市场,自2008年谷歌进军智能手机市场,模仿苹果APP模式的Android Market(现在已经改名为Android Play)应运而生,但不同于iOS,谷歌官方的Android Market在国内访问非常的缓慢,而谷歌的定位也是全球性的,上面的很多应用也是英文的,不适合国人。由于本身Android的开放性和这方面的门槛比较低,所以在国内第三方的Android应用市场如“雨后春笋”般出现,比如有名一点的比如应用汇,机锋网…所以大家可想而知其竞争有多么的激烈,其中同质化现象非常严重。如果要想在这种环境下生存下去,肯定要作出跟别人不一样的风格,从用户的角度,为用户提供一个方便,好用,不一样的应用下载方式,在这里我们就可以应用到数据挖掘这种技术,根据用户的下载习惯给用户提供个性化推荐,或者那些应用比较受欢迎及哪些应用是经常被一起下载的,还有就是某个用户下载安装了某个应用之后,还有哪些应用他会同时下载安装。
二、问题抽象
现在我们假设一个事实,一个Android应用市场的应用数是10,000个,12年4月份的应用下载安装记录个数为255,000个,每一个记录就是一些应用被下载安装,还有一个应用总表记录了每个应用被下载安装的次数。这里我提出一些问题:(a)最受欢迎的十个应用是哪几个(即做一个排行榜,其实这里应该把软件应用和游戏分开来,分别做一个排行榜)?(b)哪些应用经常是被同时下载安装的(c)若用户A下载了(手机QQ,微信),还有哪些应用可能会被他同时下载呢?带着这些问题我们来找一下解决方案。
三、解决方案
第一个问题比较简单,我们只要根据应用总表的下载量这个字段进行排序,就可以得到下载次数最多的十个应用,实际中下载量的计算应该是比较复杂的,否则很容易被别人利用,恶意推广其应用。
下面是第二个问题:(1)数据选择:我们先从应用下载安装记录中攫取出想要的资料:
(手机QQ,微信,新浪微博)
(新浪微博,手机人人,网易新闻)
(UC浏览器,QQ浏览器,有道词典)
(手机人人,QQ浏览器)
(手机QQ,微信,QQ浏览器,网易新闻)
(QQ浏览器)
(微信,新浪微博,有道词典)
(手机QQ,微信,新浪微博,手机人人,UC浏览器,QQ浏览器)
(手机QQ,新浪微博,网易新闻)
(微信,新浪微博,网易新闻)
为了方便说明,这里只取10个记录为例。并且我们将应用以下字母代替:a:手机QQ,c:微信,d:新浪微博,e:手机人人,f:UC浏览器,h:QQ浏览器,j:有道词典,k:网易新闻
(2)数据挖掘:若我们假设认为’frequency>=30%’是经常的话(即在本例

数据挖掘解决方案 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数6
  • 收藏数0 收藏
  • 顶次数0
  • 上传人63229029
  • 文件大小462 KB
  • 时间2017-11-02