下载此文档

新浪微博的用户画像是怎样构建的.docx

文档分类：经济/贸易/财会 | 页数：约4页举报非法文档有奖

1/4

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/4 下载此文档

文档列表 文档介绍

新浪微博的用户画像是怎样构建的?
从上一篇《认识每一个“你”：微博中的用户模型》里面对用户模型维度的划分可以看出，属性和兴趣维度的用户模型都可以归入用户画像(User Profile)的范畴。而所谓用户画像，简单来说就是对用户新浪微博的用户画像是怎样构建的?
从上一篇《认识每一个“你”：微博中的用户模型》里面对用户模型维度的划分可以看出，属性和兴趣维度的用户模型都可以归入用户画像(User Profile)的范畴。而所谓用户画像，简单来说就是对用户的信息进行标签化。如图1所示。一方面，标签化是对用户信息进行结构化，方便电脑的识别和处理；另一方面，标签本身也具有准确性和非二义性，也有利于人工的整理、分析和统计。
用户属性指相对静态和稳定的人口属性，例如：性别、年龄区间、地域、受教育程度、学校、公司……这些信息的收集和建立主要依靠产品本身的引导、调
查、第三方提供等。微博本身就有比较完整的用户注册引导、用户信息完善任务、认证用户审核、以及大量的合作对象等，在收集和清洗用户属性的过程中，需要注意的主要是标签的标准化以及不同来源信息的交叉验证。
用户兴趣则是更加动态和易变化的特征，首先兴趣受到人群、环境、热点事件、行业……等方面的影响，一旦这些因素发生变化，用户的兴趣容易产生迁移；其次，用户的行为〔特指在互联网上的行为〕多样且碎片化，不同行为反映出来的兴趣差异较大。接下来主要介绍一下微博画像中兴趣维度的构建方法。

1标签来源
用户自标签、达人或认证标签、公司、学校、微群标签、星座、微博关键词……这些来源都可能成为用户的标签。而针对每个特定的用户收集标签除了其自身以外，他关注用户的标签也会传递到该用户身上。如图2所示〔蓝色实线代表关注关系，橙色虚线代表兴趣标签来源〕。
2权重计算
在收集到一个用户可能存在的标签后，还需要给标签赋一定的权重，用来区分不同标签对于该用户的重要程度。不同标签的来源用户质量，标签的传递路径，转发关系，标签的本身，以及标签与用户之间的共现关系都会考虑在内。
不同质量的用户自身产生的标签权重不一样，质量越高，认为该标签的可信度越高，无论是将该标签赋给自己还是传递出去的时候其权重值越高。
标签的传递路径主要是针对基于关注关系的标签传递，亲密度比较高的关注用户传递过来的标签权重值会比较高。
标签是来自于用户的原创还是其转发的微博，权重值会有区别，一般来说原创的权重会高于转发权重。
如果标签本身是一个非常常见的词，那么它用于刻画用户的兴趣的区分性是比较差的，相反如果是一个长尾词，则区分性较强。出于这样的考虑，越是长尾词，标签的权重值会越高。
标签与用户的共现关系是指用户和该标签是否经常共同出现，评价的是两者的关联性。关联性越高，则标签的权重值越高。
综合上述的因素，一个标签对于特定用户的权重值可以大致表示为：标签权重 = (来源因子 + 亲密度因子 + 转发因子 + 长尾因子) × 共现因子。

新浪微博的用户画像是怎样构建的来自淘豆网m.daumloan.com转载请标明出处.

新浪微博的用户画像是怎样构建的.docx

新浪微博用户活跃度

新浪微博的用户画像是怎样构建的

新浪微博的用户画像是怎样构建的

新浪微博的用户画像是怎样构建的

新浪微博的用户画像是怎样构建的

新浪微博,用户,报告

新浪微博的用户画像是怎样构建的

2012年新浪微博用户发展的报告 -北大新浪

新浪微博用户关系研究

新浪微博用户关系的研究