坛数据的搜索系统系统。是一个经过良好设计与实现的系统,中文摘要答的新型τ谩!;诼厶呈菰吹腝际酢Mü韵钟新厶呈莸氖占摘要:传统的信息获取技术,如技术、互联网搜索技术对互联网中的信息获取处理和答案抽取,我们可以构建一个结构化的问题/答案库。一旦成功实现新问题给用户,解答用户的问题。这种模式的在利用互联网搜索引擎这一基础平台进行海量数据索引和查询的同时,也避免了传统技术的许多技术瓶颈以及准确率较差的缺点。基于论坛数据的技术的核心点之一在于如何从疤类型多样的回复帖子中准确抽取出高质量的答案。我们尝试了从多分类问题和排序问题这两个不同的角度看待该问题,并分别采用条件随机场P徒薪饩觥Mü嘈投ㄒ濉⑻卣鞅硎尽数据标注、模型训练、实验验证等一系列过程,最终的结果表明能够对论坛数据实现高性能的答案抽取。在此基础上,我们结合搜索引擎平台实现了一个基于论具有完善、扩展性强的体系结构以及友好的用户界面,从数据获取、数据格式化、数据处理、答案抽取、问题映射、设计等问题上都针对论坛数据进行了优化。关键词;信息获取;搜索;;论坛;答案抽取。分类号:虫塞擅墨问题给出了解决方案,但是在寻求对具体问题的解答时,它们往往难以提供令人满意的服务。在本文中,我们提出了一种利用论坛中的问题问答资源来进行问题解到问题/答案库中已有的相同/相似问题的映射,便可以将抽取出的相应答案返回珻掷嗄P秃蚏
知识水坝***@pologoogle为您整理
籹籕甌,』鞘售烫秘健捞梦宦廴瑂甌瓵:籪;瑆甇瓵,琾甀,瓸,/./·瓼瑆,,.篢.
知识水坝***@pologoogle为您整理
致谢本篇论文能够得以完成首先感谢我的导师——裘正定教授。三年来,导师在深夜的实验室里,写下毕业论文的最后一个句号,研究生的生活也即将成为生命中的一段记忆,回首身后的一串串脚印,有太多的人令我感激,有太多的往学业和生活上都给了我很多悉心的指导和热诚的关怀。从一年级的专业课程到二年级的科研项目实践直至最后的毕业论文,我成长的每一步都倾注了导师的关心和指导。他传授给我的不仅是在工作和学习中解决各种问题的方法和思路,而且包括了学习和创新的能力。导师那种兢兢业业的工作作风,严谨的治学态度和平易近人的处世方式都是我学习的楷模,这一切为我以后的科研工作打下了峰实的专业和业务基础。在论文完成过程中,他多次过问完成的具体情况,提出了许多同时要特别感谢我在微软亚洲研究院互联网搜索与挖掘组实习期间的导师徐谷老师以及给与我许多教诲的李航老师。本文中的工作都是在他们的指导和帮助下完成的。从他们身上我不仅学习到了理论和技术方面的知识,更感悟到了成为一个真正的科研人员所必备的科研精神和态度。在微软亚洲研究院实习的一年里,我还与许多来自各个大学的优秀同学一起共事,包括中科大的洪日昌、清华大学的夏昊,上海交大的陈尔东、哈工大的高立琦、南开大学的于世涛以及东南大学的江大伟等。在与他们日常的讨论和交流中我获益匪浅,再此一并表达谢意。我还要感谢我的父母,感谢他们对我始终如一的支持和关怀。最后,感谢母校,感谢所有的在我撰写毕业论文期间曾给予我支持、关心和帮助的各位老师、同学和亲朋好友,谢谢他们对我的学习和工作给予的无私帮助。事使我难忘。具有指导性的建议,并且提供相应的解决思路。
凼信息获取技术从世纪年代开始,信息的高效存储和获取成为了一个越来越严重的问题,吸引了学术界和工业界众多的关注。能否快速、高效地从浩瀚的数据源中获取感兴趣的内容,直接影响到信息的有效利用和快速传播。本章首先介绍用于解决该问题的传统信息获取技术的基本原理和发展状况,在此基础上进行全面和深入的分析、对比,并讨论存在的问题和未来发展方向。随后介绍新兴的基于论坛的信息获取方式,并引出本文的研究内容、研究目的、研究意义以及本文的结构。伴随着信息社会的快速发展,包含各种信息的海量数据每时每刻都在产生、处理、存储、传播。由于互联网的普及,通过便捷、高效、经济的互联网来查找信息成为最为普遍的信息获取手段。在当今世界的任何一个角落,通过一台可访问互联网的终端设备就可以利用几乎无穷无尽的网络资源,并与其他人进行信息点超过了诟觥H绾未又锌焖俣ㄎ桓行巳さ男畔⑹志哂刑粽叫浴4送猓上的内容质量参差不齐,除了真正富含信息的资源外,很多都是毫无信息量,甚至是用户并未主动要求的广告信息。如何从中充斥着垃圾信息的互联网中找到真琺际跷I鲜鑫侍馓峁┝艘恢钟行У慕饩方案。际跏俏A硕孕畔⒔杏行Ч芾砗头梦识⒄蛊鹄吹募扑慊Э疲ü对信息资源的表示、存储、组织、访问等问题的解决,瓜技术提供了一种对海量信息进行高效管理、查找、访问的方式。通过技术,低持С侄晕牡抵械男息、文档自身、文档元数据的查询,也支持从数据库、中查询文本、图像、音频、视频等各种类型的数据【。ⅲ罕疚闹幸宦捎梦牡道赐吵聘种类型的数据交流。但另一方面,互联网的巨大规模
基于论坛数据源的QA技术的研究与实现(可复制论文) 来自淘豆网m.daumloan.com转载请标明出处.