一类基于启发式搜索的激励学习算法.doc一类基于启发式搜索的激励学习算法2(),付强,卓佳,陈焕文(长沙理工大学计算机通讯工程学院,湖南长沙410076)摘要:,它能较好地处理未知环境问题,,在现实世界中,智能体总是会有一些环境的先验知识,,有很快的搜索速度,但需要精确的启发式信息,,提出一类新的基于启发式搜索的激励学习算法,:启发式搜索;激励学习;启发式SARSA中图分类号::A文章编号:1673—629X(2Oo6)08—0041—03AClassofReinforcementLearningAlgori由mBasedonHeuristicSearchTANGZhong-yong,FUQiang,ZLIUOJia,CHENHuan-wen(,.,Char-ha410076,China)Abstract;',!:heuristicsearch;reinforcementl-r/fing;H一SA]RSAO引言在人工智能的搜索方法中,,,A*算法就是一种典型的启发式搜索算法,被普遍应用于博弈,,启发式搜索需要设置精确的评估函数,,让智能体在与环境的交互中自行判断动作的优劣,它的优点在于无须事先知道环境
一类基于启发式搜索的激励学习算法 来自淘豆网m.daumloan.com转载请标明出处.