基于自举学习与指代消解的人物家庭网络构建研究作者:顾静航、胡亚楠、钱龙华、朱巧明报告人:,社会关系网络的分析和应用可以提高人们的生活质量和生活效率。家庭是人类社会最基本的组成单位,因而家庭网络是社会网络中的核心部分。传统的社会关系网络分析(workAnalysis,SNA)着眼于以人为个体,考察个体在网络中的作用,忽略了家庭作为一个整体对社会网络的影响。本文从构建家庭网络入手,挖掘丰富的人物家庭关系,为构造大规模的社会关系网络打下基础。.相关工作自举学习Hearst(1992):基于模式匹配来抽取“is-a”关系Pantel等(2006):Espresso,解决模式和实例的可信度问题姚从磊等(2007):采用模拟退火算法发现网页中蕴涵的人物社会关系社会关系网络Kautz等(1997):ReferralWeb,利用人名共现实现社会网络挖掘Mika等(2005):同ReferralWeb,(续)社会关系网络(续)唐杰等(2008):Miner,建立学术人物之间的社会关系网络Elson等(2010)、Agarwal等(2012):对小说中人物的社会关系网络进行了研究,提出了隐式社会关系的概念Camp和Bosch等(2011):从人物自传中提取带有情感极性的人物社会关系Zhu等(2009):StatSnowball,采用自举方法进行人物社会关系的抽取,融合概率模型和马尔科夫逻辑网络等方法,实现“微软人立方”.研究方法基于自举学习的人物家庭关系抽取:家庭关系定义:“Parent-Child”和“Husband-Wife”。为了便于自举过程的进行,“Parent-Child”关系类型又被细分为“Father-Son”、“Father-Daughter”、“Mother-Son”和“Mother-Daughter”自举学习过程::给定种子“江泽民,王冶坪”抽取出文本“……中江泽民的夫人王冶坪今天下午……”抽取模式,得“<Husband>的夫人<Wife>”研究方法(续).研究方法(续)模式评估:采用PMI衡量模式p与人物对{x,y}之间的关联强度定义模式p的可信度为rπ(p),(续)实例发现:利用已有模式发现实例如模式“<Husband>的夫人<Wife>”可以得到句子“……中国国务院总理李鹏的夫人朱琳8日上午来到……”进行分词、人名识别,可以发现新的夫妻关系实例“李鹏,朱琳”。.研究方法(续)实例评估:定义实例i的可信度为rl(i),它与每个模式p的平均关联程度有关PMI方法对于低频事件有偏向性,所以引入打折因子.
java语言程序设计基础ppt课件 来自淘豆网m.daumloan.com转载请标明出处.