用户画像数据建模方法
从1991年TimBerners-Lee发了然万维网(WorldWideWeb)开始,到20年后2011年,互联
网真实走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们渐渐冷
静下来,更向我们展示了一种朴实、简短的方法用于描绘用户信息。
数据源剖析
建立用户画像是为了复原用户信息,因此数据根源于:所有用户有关的数据。
对于用户有关数据的分类,引入一种重要的分类思想:关闭性的分类方式。如,世界上分为两种
人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,廉价值客
;品生命周期分,投入期、成期、成熟期、衰败期⋯所有的子分将组成了目空的全部会合。
的分方式,有助于后不断枚并迭代充漏的信息度。不必担心架构上每一分没有考完整,造成度漏留下展性患。此外,不同的分方式根据用景,需求的不同,也各有道理,按需区分即可。
本文将用数据区分静信息数据、信息数据两大。
静信息数据
用相定的信息,如所示,主要包括人口属性、商属性等方面数据。信息,自成,如果企有真信息无需多建模,更多的是数据冲洗工作,因此方面信息的数据建模不是本篇文章重点。
信息数据
用不断化的行信息,如果存在上帝,每一个人的行都在刻被上帝那双无形的眼睛控着,广上,一个用翻开网,了一个杯子;与用夜晚溜了趟狗,白天取了一次,打了一个哈欠等等一都是上帝眼中的用行。当行集中到互网,以致商,用行就汇聚焦好多,如上所示:凡客首、休鞋品、搜寻帆布鞋、表对于鞋品的微博、“双十一大促力”的微博消息。等等均可看作互网用行。
本篇文章以互网商用,主要剖析象,不考下用行数据(剖析方法相同,只是数据取途径,用方式有些差别)。
在互网上,用行,能够看作用信息的唯一数据根源。怎样用行数据建立数据模型,剖析出用,将是本文着重介的内容。
目剖析
用画像的目是通剖析用行,最每个用打上,以及的重。如,酒、李宁。
,表征了内容,用内容有趣、偏好、需求等等。
重,表征了指数,用的趣、偏好指数,也可能表征用的需求度,能够的理解可信度,概率。
数据建模方法
下面内容将介,怎样根据用行,建立模型出、重。一个事件模型包括:、地址、人物三个要素。每一次用行本上是一次随机事件,能够描绘:什么用,在什么,什么地址,做了什么事。
什么用:关在于用的,用的目的是了区分用、点定位。
以上列了互网主要的用方法,取方式由易到。企的用粘性,能够取的信息有所差别。
什么:包括两个重要信息,戳+度。戳,了用行的点,如,(精度到秒),(精度到微秒),往常采用精度到秒的戳即可。因微秒的戳精度并不可
靠。器精度,正确度最多也只能到毫秒。度,了用在某一面的停留。
什么地址:用户接触点,TouchPoint。对于每个用户接触点。潜在包含了两层信息:网址+内
容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或许某个产品的特定页面。能够是PC上某电商网站的页面url,也能够是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信定阅号页面,某游戏的过关页。
内容:每个url网址(页面/屏幕)中的内容。能够是单品的有关信息:类型、品牌、描绘、属性、
网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定
用户画像数据建模方法计划 来自淘豆网m.daumloan.com转载请标明出处.