下载此文档

基于社交网络数据的用户群体画像构建方法研究.doc


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
基于社交网络数据的用户群体画像构建方法研究
摘 要:随着网络技术的发展,社交网络成为人们信息获取、观点分享的主要平台,在人们日常生活中占据重要地位。对社交网络信息进行挖掘,构建社交网络用户群体画像,对用户个性化服务、商业精户信息进行挖掘,分析用户偏好,有助于充分了解用户群体,为社交平台用户个性化服务提供思路[1,2],为商业智能精准营销搜索目标受众[3],对敏感人群进行监控预警及疏导,为舆情监控引导提供决策支持。目前,在用户群体画像构建方面已有不少研究成果,但是还存在一定的局限性,社交网络用户群体画像全面性精准性有所欠缺,一方面当前社交网络用户数据挖掘分析多集中在某类用户,选取部分用户作为研究对象,没有对社交网络用户整体进行群体画像研究。如魏明珠等人[4]对社交媒体中的高影响力人物进行画像研究;欧阳秀平等人[5]对游戏用户构建游戏兴趣偏好画像;唐嘉泉[6]构建旅游用户画像并进行游客身份分类。另一方面,用户群体画像越全面,对用户群体了解越深刻。然而,现有研究多在某类特征[7,8]或某几个特征维度构建用户群体画像,如兴趣偏好等。涉及特征种类较少,没有在多类特征维度对社交网络用户进行全面刻画。如任金玥[9]提取用户主题特征构建用户分类画像;郭光明[10]构建社交网络用户信用画像;刘禹辰等人[11]构建社交网络用户情绪智力画像。为充分了解社交网络用户,对社交网络用户群体进行全面刻画,本文提出了一种基于社交网络数据的用户群体画像构建方法,在用户主题、位置、软件使用、发文习惯、表情符使用偏好等方面对用户群体进行分析,对社交网络用户进行多维度全面刻画,构建比较全面、完善的社交网络用户群体画像,为商业精准营销、平台个性化服务、舆情监控提供参考依据。 本文的主要贡献为:
(1)本文在基本特征、内容特征、统计特征、行为特征四大类20小类特征维度对用户进行刻画,构建更加全面精准的用户群体画像,充分了解了用户群体兴趣偏好、行为倾向及价值诉求。
(2)本文对社交网络用户整体进行群体画像研究,用户群体覆盖面广,更加完整地揭示社交网络中用户群体的构成及特点,充分全面地了解社交网络用户。
2 社交网络用户群体画像构建模型
构建流程
社交网络用户群体画像构建模型如图1所示,包括数据收集及预处理、特征提取、特征融合、用户画像构建、聚类分析群体画像构建五个阶段。
在数据收集及预处理阶段,采集用户基本信息、博文内容、用户间关注关系、用户互动信息数据。筛选用户,去除冗余数据,使用Jieba对博文内容数据进行分词处理,使用Word2vec训练博文词向量(300维)。得到分词后的微博内容、用户基本信息、用户间的关注关系、用户互动信息、单个词汇的Word2vec向量表示。
在特征提取阶段,对用户基本信息、分词后的博文内容、用户间关注关系、用户互动信息数据进行处理,提取用户基本特征、内容特征、统计特征、行为特征四大类21小类特征。从基本信息中提取用户基本特征。从博文内容中提取用户13小类内容特征,使用LDA提取用户博文主题特征,使用正则表达式提取用户博文内容数据中的话题、位置、表情符、标点符号、电影、音乐、旅游、食物、语气词、出行方式、发文设备、第三方软件等特征。对用户数据统计分析得到用户统计特征,包括用户发文习惯、博文统计特征、关注的人统计特征、粉丝统计特征、好友统计特征。从用户互动信息数据中得到用户行为特征。使用博文中词汇的Word2vec[12]向量累加求平均值得到单条博文的向量表示,将表情符“太开心”“怒”作为正负情感标签,使用BP神经网络训练单条微博情感模型,%。。
特征提取阶段得到的用户特征粒度太细、维度过高、可解释性不强,如1481维的情感符特征维度过高,不能对用户进行直观刻画。使用特征融合技术可以将高维度特征聚合为较为抽象的高层次用户特征。在特征融合阶段,对特征提取阶段得到的特征进行聚类分析结合人工标注,进行特征融合得到高层次用户特征。如将出行工具融合为18维出行方式特征,从第三方软件中得到第三方软件类别特征,将表情符号进行分类得到表情符类别特征,从发文设备型号中得到设备系统及品牌。将市、县级位置融合省级位置,将话题特征融合为话题主题。
在用户画像构建阶段,在特征融合阶段得到的基本特征、内容特征、统计特征、行为特征四大类20小类用户特征基础上构建用户画像。
在聚类分析群体画像阶段,使用SVD对用户特征数据降维,使用Kmeans对社交网络用户进行聚类分析,得到用户群体,提取用户群体特征,使用用户群体特征均值表示用户群体的基本、内容、统计、行为特征,构建社交网络用户群体画像。全面的用户

基于社交网络数据的用户群体画像构建方法研究 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人学习的一点
  • 文件大小20 KB
  • 时间2022-05-16