下载此文档

网络舆情的概念.doc


文档分类:生活休闲 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
网络舆情
客户 项目
核心是文章,是最小单位,有很多属性:
基本属性(标题、内容、发布时间、来源、作者)
高级属性:点击量 评论 评论数 转载 转载数
文章仅适用于新闻论坛博客微博
文章集合:若干个相同的文章(相同的概网络舆情
客户 项目
核心是文章,是最小单位,有很多属性:
基本属性(标题、内容、发布时间、来源、作者)
高级属性:点击量 评论 评论数 转载 转载数
文章仅适用于新闻论坛博客微博
文章集合:若干个相同的文章(相同的概念)()
文章识别码 + url地址=共同组合成为文章 一个识别码+多个URL就是文章集合。Articlcode articlpass
很多新闻可以出现在多个网站,但可以来源于一个网站
文章 分类
归类 (用户) 分类 用户定义的项目
用户在进行分类,就是用户要定义的项目。
怎么分类: 贝叶斯算法 关键词出现的次数
归类:关键词匹配(支持组合关键词)
事件:
舆情监测的目的是为了发现事件。有可能是(潜在的、未发生的)内容。事件是有特征的,人物、地点、开始、发展(点击量、转载量、评论);会有跟多的人去关注它。
案例:文章的瞬间转载量超过50 ,那么它讲述的内容有可能成为事件,潜在的危险事件。系统就会把文章提取出来,通过事件展示给用户。判断事件会真正成为事件,用户要进行沉淀,沉淀出中心思想(组合短语)。提取出组合短语后,这个事件就真正启动,系统就开始继续监测。
事件的定义:通过事件聚合为文章的大的集合,不同的文章报道的都是一个主题。
舆情:提前发现潜在的危险
活动:可预知的一种行为,比如中博会的举办,但是对中博会要发生什么事件。
活动主题:组合关键词,汇聚成为一个文章组合。
网络矿工舆情监测系统
事件 未知的 系统推出一篇文章,提出一个主题进行监控。
可预知的 客户知道要发生的事。
舆情
引擎: 采集 分析 跟踪 预警 这些数据都沉淀在数据库中
管理:用户可以对项目和文章进行修改,进行完整的统计报表的浏览
前台网站:对所有用户
采集 全网监控 精确监控 爬虫监控
数据采集引擎 高效 单位成本 单台服务器每天可采集30万-40万的网页。
分析引擎 文本归类 对文章正负面分析 点击回复转载来分析 文章唯一识别码 事前分析(起始 高潮 急速) 对递增量进行控
跟踪引擎 辅

网络舆情的概念 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人文库旗舰店
  • 文件大小20 KB
  • 时间2022-06-08