基于射频控制的智能照明系统设计.doc


文档分类:IT计算机 | 页数:约126页 举报非法文档有奖
1/126
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/126
文档列表 文档介绍
版权声明
任何收存和保管本论文各种版本的单位和个人,未经本论文作者同意,不得将本论文转借他人并复制、抄录、拍照、或以任何方式传播。否则,引起有碍作者著作权益之问题,将可能承担法律责任。
摘要:
命名实体是现实社会中一个具体的事物,而在Web上的网页文本中有大量的有关命名实体的内容。这些内容中有些是描述实体的静态属性信息,例如实体的属性,实体之间的关系。描述实体静态信息的文本一般为较短的包含实体的单个句子,而且其信息内容不会随时间产生明显变化。而另一些包含实体的文本内容描述的是实体的动态信息,主要是描述实体参与到新闻事件中,并且在新闻事件中的行为。包含后一种实体信息的内容较之前一种内容要更长,一般包含若干句子构成一段内容相对统一的文本子段,而且其内容信息也会随时间变化而发生明显变化。本文希望通过采用对网页文本中包含实体的上下文进行分析挖掘这一基本方法,分别解决利用实体共现文本发现实体间关系的问题和以实体为核心的事件发现与追踪的问题。概括而言,本文在这两个研究问题上的主要贡献包括: 
(一)Web实体关系实例的提取
实体关系在网页文本中的一种重要体现形式,是处于特定关系的实体对共同出现在一段描述这种关系的文本中。这里我们定义这段描述特定实体关系的文本为web实体关系实例。能否提取足够数量与较高质量的Web实体关系实例是能否有效地发现实体间关系的重要前提工作。
已有的使用命名实体上下文来发现命名实体之间关系的工作,一般是直接使用包含命名实体对的句子作为表示关系对的特征。这种做法存在两个明显的问题:其一,在海量网页文本中包含命名实体共现的句子除了描述实体间关系的Web实体关系实例之外,还可能是描述两个实体同时参与到一个事件这样的动态特征。其二,由于描述实体关系的句子长度比传统文本分类语料的长度要小很多,即使描述相同类型实体关系的文本也可能在词汇特征上有很大差异。本文中的实验也验证了直接使用网页文本中实体上下文作为实体关系对特征会对实体关系发现带来的负面影响。
因此,我们提出了描述实体关系的实体上下文的筛选与扩充这两个新的研究问题。在此基础上,本文提出了一种有效的方法来解决上述两个问题。该方法首先利用对Wikipedia和百度百科中描述实体关系的文本进行分析挖掘,学习得到描述实体关系的语言模型,利用贝叶斯公式计算实体共现句子包含实体关系信息的概率并依此对共现句子进行筛选;其次,该方法利用搜索引擎作为媒介,通过将描述实体关系的实体共现文本作为查询投送到搜索引擎,得到在互联网中其他描述同一实体关系对的文本作为描述该实体对的文本的扩充,通过迭代执行实体对上下文的筛选与扩充,最终得到表示每个实体对的文本特征。 
(二)基于图扩散的实体关系类型标注方法
通过上述工作,我们将每个实体关系对表示为该实体对在网页中的web实体关系实例,下一步的工作是对这些web实体关系实例标注其所描述的关系类型。在本文的工作中,我们使用NIST举办的ACE(Automatic Content Extraction)评测中提供的命名实体关系分类体系,这一体系包括三大类实体间关系:人物-人物间关系、人物-机构间关系、人物-地点间关系,以及11个具体关系子类。为了确定每个实体关系对的关系类型,前期研究者所使用的实体关系类型标注方法主要是以一定数量的、有标注类别的、描述各类实体关系文本作为训练集,通过传统的有监督学习方法,例如kNN,SVM等,将待标注类型的实体对的共现文本分类到特定的实体关系类别,并依此来标注实体对的关系类型。由于我们要处理的网页文本的特点是数据量巨大,语言规范性不强,因此在网页文本数据上人工标注、或者自动获取一个足够数量与较高质量的描述各类实体关系的训练集都是一项困难的工作。
因此,我们提出了一种新的利用图扩散的实体关系标注方法,所需的人工干预只是对每种关系类别标注少数几个实体对。该方法以共现的实体对作为顶点,以实体对上下文之间的相似度来建立边,构建一个无向加权图,并利用边上的权重将少数几个已标注类别顶点的类别信息,通过半监督学习的迭代扩散方法将少数已标注结点的类别信息在整个图中进行传播,在传播到达平衡的时候获得图中顶点即所有实体对的关系类型信息。通过实验,该方法在标注数据量很少的情况下效果
要明显好于已有研究中使用的有监督学习的方法,实验结果也表明利用这种方法所得的实体关系类型结果并不依赖于前期标注的实体对的集合与数量。
(三)基于多维网页文档特征的新闻网页表示模型
事件是一个可观察、非平凡的现象,一个事件包含的元素可以是事件发生时间、事件发生地点,事件经过和参与事件的实体等重要信息。事件在网页中的反映是新闻网页,新闻网页较之传统的新闻媒体(如报纸、广播等)只包含正文特征,新闻网页具有更多有利于新闻事件发现的特征信息,例如网页的

基于射频控制的智能照明系统设计 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数126
  • 收藏数0 收藏
  • 顶次数0
  • 上传人策划大师
  • 文件大小0 KB
  • 时间2011-11-13