下载此文档

基于演化算法的唐诗自动生成系统研究.doc


文档分类:IT计算机 | 页数:约13页 举报非法文档有奖
1/13
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/13 下载此文档
文档列表 文档介绍
基于演化算法的唐诗自动生成系统研究
作者:穆肇南 刘梦珠 孙界平 王成

摘要::使用GloVe(,所以选取大量唐诗语料库进行切分,生成单字词;.
(1)单字词,包括的数据项有编号、词语、拼音、平仄、词语频率、词语词性.
(2)诗句表,包括的数据项有编号、诗句.
由上述分析可知,本系统需要设计两张表:.
根据数据库分析中的存单字表的数据项可以设计出单字表,如表1所示.
同理,根据数据库分析中的存诗句表的数据项可以设计出诗句表,包含的字段有字段名、数据类型、长度、描述.
该模块实现的是对已有的唐诗的每行诗进行单字词的切分和各行诗诗句的切分,以及数据库建立的功能.
数据库建立包括对单字词进行词性、拼音、音韵、,利用注音工具对单字词的拼音进行标注,利用高频词查询工具对单字词的词频进行标注;继而利用SQL实现对单字表音韵的标注.
基于演化算法的唐诗机器自动生成设计根据适应度函数值的大小进行优胜劣汰,、语法结构、语义呈现及情感表达等方面的研究,总结出了唐诗的质量主要体现在语法的规范性和语义的关联度两方面.
在语法方面,主要考虑两个方面:一是唐诗词性组合规则;,,.
诗歌在语义方面要求风格统一、主题连贯、,本系统主要使用GloVe模型计算两个单词之间的语义相似性,(Latent Semantic Analysis,LSA)的全局统计信息和局部上下文窗口(Local Context Window,LCW),可以加快模型的训练速度,.
第一步,根据语料库构建一个共现矩阵X,,这个次数的最小单位为1,但是GloVe模型根据两个单词在上下文窗口的距离d提出了一个衰减函数decay=1/d,用于计算权重,也就是说距离越远的两个单词所占总计数的权重越小.
通过以上模型计算两个单词之间的语义相似性,进而建立词与词之间的关联度,使词与词之间更有凝聚力,使产生的句子看起来更有意义,.

基于演化算法生成模块主要是实现生成仿唐诗的功能,主要包括初始种群的生成、适应度值的计算、选择操作、交叉、变异这5个步骤.
首先,种群的初始化主要步骤如下.
第一,根据给定的主题词,从数据库中抽取与其相关的候选词,构成候选词空间.
第二,从候选词空间随机选择高频词进行随机组合,生成一首五言仿唐诗.
第三,判断生成的仿唐诗的第二行诗押的是什么韵脚,如押的是仄韵,那就再判断仿唐诗第四句是不是同样押的仄韵,如若不是则随机从候选词空间选择一个押仄韵且与韵脚语义相关度强的高频词来替换原来的词,从而使得整个诗歌押的都是仄韵;重复此操作,直到最终能够生成含有N个个体的初始种群.
其次,(C)、是否符合押韵平仄规则(Y)以及词义相关度(X),适应度函数F为以上3个测量依据归一化后的加权值,即
再次,就是选择操作,,算法具体实现是通过父代与之生成的子代进行比较,适应度值高的个体会存活下来继续产生下一代个体,.
最后,,

基于演化算法的唐诗自动生成系统研究 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
最近更新