登录
|
注册
|
QQ账号登录
|
常见问题
联系我们:
我要上传
首页
浏览
幼儿/小学教育
中学教育
高等教育
研究生考试
外语学习
资格/认证考试
论文
IT计算机
经济/贸易/财会
管理/人力资源
建筑/环境
汽车/机械/制造
研究报告
办公文档
生活休闲
金融/股票/期货
法律/法学
通信/电子
医学/心理学
行业资料
文学/艺术/军事/历史
我的淘豆
我要上传
帮助中心
复制
下载此文档
一种基于CNN与双向LSTM融合的文本情感分类方法.docx
文档分类:
论文
|
页数:约12页
举报非法文档有奖
分享到:
1
/
12
下载此文档
搜索
下载此文档
关闭预览
下载提示
1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档,不会出现我们的网址水印。
同意并开始全文预览
(约 1-6 秒)
下载文档到电脑,查找使用更方便
下 载
还剩?页未读,
继续阅读
分享到:
1
/
12
下载此文档
文档列表
文档介绍
一种基于CNN与双向LSTM融合的文本情感分类方法.docx
一种基于CNN与双向LSTM融合的文本情感分类方法
张翠 周茂杰
摘 要: 现在文本情感分类普遍采用深度学习的方法。卷积神经网络可以较好地提取局部特征,但是缺少對上下文的理解。长短记忆网络可在图像处理及音频识别领域中取得了成功,一些学者将此方法推广应用到文本处理上,经过多年的应
用实践,证明深度学习方法用在文本处理上是可行的。与传统的文本分类算法相比,深度学习算法能自动提取特征,加快处理速度,显著提高分类效果。
深度学习的核心是利用多重非线性变换结构对数据进行高阶抽象,并最终完成数据特征识别的一种算法[1]。神经网络是深度学习中重要的模型之一,经过多年的发展,产生了多个变种,每种神经网络都有自己的优势。卷积神经网络(CNN)利用卷积核进行移动计算,可以较好的提取局部特征[2-4],但利用CNN进行文本识别,不能解决长文本的上下文依赖。
循环神经网络(RNN)以序列形式输入数据[5],输出数据要对当前数据及前后数据都有所依赖,可以提取全局特征,LSTM(Long Short-Term Memory)是循环神经网络的一种,利用三门设计方法,解决了长期依赖导致的梯度消失和梯度爆炸问题[6]。
本文设计一种CNN与LSTM结合的深度学习模型,发挥CNN的局部特征提取优势,并且从全局上理解文本的情感特征。首先利用CNN提取局部特征,利用LSTM获取上下文相关信息,然后将两种特征信息的向量进行拼接,拼接后的特征向量作为文本的特征向量,将两种神经网络有机结合,在文本情感识别上取得较好效果。
1 相关工作
情感分析的原理是通过对情感文本的分析,挖掘出文本所表达情感的极性和强烈程度。目前,情感分类主要是通过规则、情感词典和机器学习两种方法。近年来,机器学习方法取得了较大进步,情感分类的效果也大大改善。
机器学习方法中用得最多的是卷积神经网络(CNN)和循环神经网络(RNN)。Kalchbrenner等提出了利用CNN来进行自然语言处理[7],提出了动态卷积神经网络(DCNN) 模型,适应不同长度的文本,对不规则文本的处理效果较好;Kim在利用词向量与卷积神经网络结合实现了句子级的分类任务[8]。卷积神经网络在文本分类应用中取得了较大的进步,但是它更关注局部特征,忽略了上下文的关系,文本的语义和情感都对上下文有较强的依赖作用,所以在文本的语义情感分类中,准确率有一些影响。
循环神经网络以序列形式接受文本中的词向量输入,不但有当前位置上的信息,而且有临近位置的信息,可以有效地解决上下文依赖问题[9]。长短记忆网络模型是循环神经网络的一个子类,它在神经网络单元中加入三个门,可以避免长距离依赖产生的梯度消失问题,同时具有更强的记忆功能,对文本的识别能力更强。
2 情感模型研究
CNN模型
卷积神经网络利用卷积核与原始数据相乘,提取局部特征,因为在一个卷积神经网络中可以采用多个不同类型的卷积核,从而提取多个局部特征,因此具有较强的局部特征提取能力。因为相邻的词之间具有一定的修饰关系,并可以表达出情感倾向,所以本文在进行文本情感识别时,首先利用word2vec方法将文本构造成向量集,在文本的向量集合中采用卷积运算,进行局部特征提取,经过池化层后得到用于分类的输出向量,最后利Softmax函数进行数据分类。
例如,句子分词后得到n个词,表示为:[S=w1,w2,…,wn],其中wi表示句中第i个词,向量化后可得[wi=Vwi],其中[Vwi∈Rn*d],表示S由组成n个词构成,每个词转化为d维向理,构成了向量矩阵。
在分类时,把词向量当作独立的个体,所以采用Fk=k*d维卷积核与向量矩阵进行卷积计算,分别表k个词之间的局部联系,特征提取如公式⑴所示。
⑴
Ci表示经过一次卷积计算得到的局部特征值,f表示一个RELU函数,Fk表示k*d维滤波器,b表示偏置值,经过卷积核在矩阵上滑动计算一轮后得到完成的一个完整的局部特征向量C,记为:
⑵
为了降低向量维度,采用最大池化函数对C进行池化操作,。其中m为池化宽度。
⑶
di为卷积所提取特征,将所有的特征向量送到全连接层,最后的用Softmax激活函数的输出层。可以根据输出数据判断出输入词向量的情感极性。
LSTM模型
1997年,Hochreiter首先提出了长短记忆网络LSTM(Long Short-Term Memory)[7],它是一种特殊循环神经网络(RNN),它可以有效解決RNN的梯度消失或梯度爆炸的问题,能够学习到长期的依赖关系。与RNN相比,LSTM对神经单元(Cell)的控制器进行了设计,能够判断信息是否有用,Cell控制单元如图1所示。
在 LSTM模型中的控制单元由一个用于记录状态的记忆
一种基于CNN与双向LSTM融合的文本情感分类方法 来自淘豆网m.daumloan.com转载请标明出处.
猜你喜欢
2025年金华中考化学试卷解析版
11页
杠杆百分表和千分表使用方法
17页
2025年让数学评价多元化-年文档
5页
2025年营改增实务税务局解答13个营改增业务问..
4页
2025年细节描写作文训练
5页
2025年第六章质量与密度重点知识总结
6页
2025年税务注销-您到底了解吗?
5页
2025年环境学导论知识点
14页
2025年物业管理人员培训计划
11页
2025年浙江大学机械工程及自动化专业培养方案..
134页
2025年浅谈多元价值观下教师的价值选择-教育文..
6页
2025年杜甫《登高》教案高品质版
5页
2025年春季防传染病演练总结文档
2页
2025年新部编版三年级数学下册期末试卷及答案..
5页
2025年新版《教育心理学》复习重点
5页
相关文档
更多>>
非法内容举报中心
文档信息
页数
:
12
收藏数
:
0
收藏
顶次数
:
0
顶
上传人
:
科技星球
文件大小
:
180 KB
时间
:
2022-08-03
相关标签
lstm情感分析
双向情感障碍症的治疗方法
文本分类算法
文本情感分析
浮漂的种类与使用方法
鱼竿的种类与使用方法
灭火的三种基本方法
python文本情感分析
路亚饵的种类与使用方法
个人简介100字
期刊/会议论文
开题报告
经济论文
管理论文
社科论文
文学论文
医学论文
哲学论文
法律论文
自然科学论文
通讯论文
论文指导/设计
毕业论文
大学论文
最近更新
2025年管理干部竞聘演讲稿(共13篇)
2025年管理工作个人述职报告(推荐13篇)
熊猫烧香病毒剖析
[中考英语阅读理解题目解析]怎样做英语阅读..
2025年初一几何关于角的练习题
word习题2
XX县农业循环经济协会党支部学习实践科学发..
2025年管理专业求职信模板-大文斗范文网
HPV检测应用于早期宫颈癌筛查中的意义
2025年祖父的园子教学反思汇编篇
2025年分数的意义和性质知识点总结
2025年简约幸福个性签名(共10篇)
b2驾照科目二考试技巧
2025年简短经典猪年谢师宴学生致辞(集锦19..
5月6日补充练习
5初二数学教师专业水平训练(4)因式分解
户外音乐节项目融资计划书
一年级下学期生命教育全册教学课件
户外音乐节项目融资方案
初中必背古诗词
2023年废钢行业分析报告及未来五至十年行业..
中国大陆及邻区板内应力场的动力学模拟
皮带运输机安装方案设计
花生红衣去皮机设计【含7张CAD图纸】
浅析六年级体育与健康课程结构图解说
搅拌机料桶的注塑模具设计【含8张CAD图纸】..
在线
客服
微信
客服
意见
反馈
手机
查看
返回
顶部