知网一中文信结构
董振东董强
中科院计算机语言信息工程研究中心
语言知识研究室
e-mail:******@public,
Iel:(86106287-5641
Iel:(8610)6676-8816
提纲
◆前言
什么是中文信息结构
为什么要研究中文信息结构
怎样研究中文信息结构
中文信息结构库
中文信息结构库的应用
前言
《知网》是不依赖于特定语言的;信息结构
是依赖于特定语言的。不同的语言可表达相
同的信息,但有着不同的信息结构。
《知网—中文信息结构库》的研究与建设,
是《知网》这一知识系统向中文研究延伸的
具体体现。
概况
◆1996年知网-中文信息结构的理论研究
1998年国家语委******@YY01课题支持
1999年香港大学教育资助委员会基金
项目 HKUST6149支持
词今词语
语义结构→信息结构
结构模式→建库
什么是中文信息结构
由两个或两个以上的字、词或短语构成的
句法和语义合理的、并传达特定信息的结
构,该结构内不含有介词、助词、连词、
标点,该结构内部允许呈递归形态。
中文语言结构及其类型
◆结构的特性
规定性
稳定性
递归性
词、短语、句的共同性
结构的类型
语音结构
句法结构
语义结构
信息结构
1语音结构
◆基本单元:字、词
规定性表现:
音节约束
发音变化
2句法结构
基本单元:词语词类
规定性表现:
句法关系管辖
3语义结构
基本单元:词语义类
规定性表现:
显性角色关系管辖
4信息结构
◆基本单元:词语义类及语义属性
◆规定性表现:
显性角色关系管辖
道-路,花草,树叶,草-地,河虾,晨曦,逃犯
走私一犯,毒品走私一犯,境外-毒品一走私-集团,
现代-汉语-词典,不锈钢-汽油-桶,高-跟-鞋,独-臂英雄
走私一香烟,香烟-走私,走私一香烟
隐性角色关系管辖
花园-洋房,饺子馆
韭菜炒一鸡蛋,陈-方-安生,
知网-中文信息结构 来自淘豆网m.daumloan.com转载请标明出处.