基于RNN句子编码器的聊天机器人.doc基于RNN句子编码器的聊天机器人朱晶晶韩立新河海大学计算机与信息学院摘要:人机对话是自然语言处理领域衍生的一项现实应用场景,根据现实获取的大量短文本知识数据,构建单轮短对话式智能应答聊天机器人。本文基于传统的信息检索式聊天机器人,引入循环神经网络(RNN)深度表征交互式知识库中短文本的语义向量,重构表达式语义空间。实验表明该编码向量的方法比传统的利用TF-IDF向量的方法效果更好。关键词:聊天机器人;RNN句子编码器;TFTDF;作者简介:朱晶晶(1993-),男,安徽马鞍山人,河海大学计算机与信息学院硕士研究生,研究方向:机器学习,自然语言处理;作者简介:韩立新(1967-),男,江苏南京人,研究员,博士生导师,博士,研究方向:信息检索,模式识别,数据挖掘。收稿日期:2017-05-22ChatterbotsBasedonRNNSentenceAuto-encoderZHUJing-jingHANLi-puterandInformation,HohaiUniversity;Abstract:Man-,theman-,work(RNN)-:chatterbot;R«sentenceauto-encoder;TFTDF;Received:2017-05-220引言近些年人工智能的研究非常热门,聊天机器人作为人工智能的一个重要研究课题,得到工业界和学术界的广泛关注[1-2]°目前很多大公司都有自己的聊天机器人产品,如百度的小度、微软的小冰、苹果的Sir等。当下学术界对于聊天机器人的研究主要产生了2个模型:基于检索的模型(检索模型)和基于生成的模型(生成模型)。检索模型比较简单,其效果主要依赖于知识库、检索技术和排序特征的提取。生成模型依赖大量的训练数据,但其对自然语言的语义特征表示能力是很强大的。Ji等也利用传统IT-IDF检索技术构建聊天机器人。Cho等也使用R燃短语编码器表示短语语义向量。本文结合了检索模型和生成模型的双重优势,结构化统一端对端的句子语义向量训练方式,基于RNN的句子编码器构建短对话式聊天机器人。相比传统的TF-IDF方法,利用该编码器对句子进行深度语义编码能够更好地表示句子语义从而提升检索效果。在此基础上,基于此编码器提取了新的特征用于回答排
基于RNN句子编码器的聊天机器人 来自淘豆网m.daumloan.com转载请标明出处.