现代汉语语义词典规范.DOC

上传人:天*** 文档编号:691593 上传时间:2018-10-27 格式:DOC 页数:12 大小:225.50KB
下载 相关 举报
现代汉语语义词典规范.DOC_第1页
第1页 / 共12页
现代汉语语义词典规范.DOC_第2页
第2页 / 共12页
现代汉语语义词典规范.DOC_第3页
第3页 / 共12页
现代汉语语义词典规范.DOC_第4页
第4页 / 共12页
现代汉语语义词典规范.DOC_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、现代汉语语义词典规范 1王惠Email: 摘要:“现代汉语语义词典”(SKCC)是一部面向自然语言信息处理的语义知识库,它以数据库文件形式收录了 6.6 万余条汉语实词,不仅给出了每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的配价信息和多种语义组合限制,可以为包括机器翻译在内的多种中文信息处理系统中的语义自动分析提供强有力的支持,同时,对于汉语词汇语义学和计算词典学研究也具有重要的意义。本文概要介绍这部语义词典的结构、内容,以及语义属性项目的填写规范。 关键词:语义知识库 语义类 配价信息 计算词典学 中文信息处理The Specification of The Semantic

2、 Knowledge-base of Contemporary Chinese Wang Hui1, Yu Shiwen1, Zhan Weidong21(Institute of Computational Linguistics, Peking University, Beijing 100871, China )2(Dept. of Chinese Language ; Abstract: The Semantic Knowledge-base of Contemporary Chinese (SKCC) is a large machine-readable dictionary de

3、veloped by the Institute of Computational Linguistics and Chinese Department of Peking University. It can provide a large amount of semantic information such as semantic hierarchy and collocation features of 66,539 Chinese words. Its semantic classification system represents the latest progress in C

4、hinese linguistics and language engineering. The descriptions of semantic attributes are fairly thorough, comprehensive and authoritative. The paper introduces the outline and specification of SKCC, and indicates that, as a large scale fundamental semantic resource of Chinese, SKCC will not only pro

5、vide valuable semantic knowledge for Chinese language processing, but also play an important role in Chinese lexical semantics and computational lexicography research. Key words: Semantic knowledge-base, lexical semantic, computational lexicography, semantic hierarchy, valence information, Chinese l

6、anguage processing1本研究得到国家 973 重点基础研究项目“面向新闻领域的汉英机器翻译系统” (项目号:G1998030507-4)与“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究” (项目号:G1998030507-1)的支持。现代汉语语义词典规格说明书 - 2 -21 引言在自然语言处理中,语义分析占有很重要的位置。北京大学计算语言学研究所与中科院计算所自 1994 年联合开发“汉英机器翻译模型系统”开始,就着手研制面向汉英机器翻译的“现代汉语语义词典” (SKCC) ,目的是在语法分析的基础上,为计算机自动分析汉语句子和生成英语句子提供更深

7、入的语义信息。1996 年至 1998 年,双方共同承担了国家863 高科技项目“通用机器翻译开发平台和汉英机器翻译系统”课题(项目编号: 863-306-03-06-2) 。作为该课题的一个重要组成部分, “现代汉语语义词典 ”进入到大规模开发阶段,并取得阶段性成果,完成了 4.9 万汉语常用实词 (名词、动词、形容词) 及部分成语、习用语的语义分类和搭配信息描述 1。IBM、Intel、Fujitsu, Toshiba, NTT, Canon, Sail-labs 等 20多家公司与大学先后从北大购买了该词典的许可使用权。4 年多来,北京大学计算语言学研究所在积极应用、推广该词典的同时,仍

8、不断地投入力量进行词典本身的发展。从 2001 年 11 月开始, “现代汉语语义词典”的二期开发工作受到了国家 973 重点基础研究项目“面向新闻领域的汉英机器翻译系统”和“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”的支持,由计算语言学研究所和中文系联合承担,对词典规模进行较大幅度的扩充,并对全部词语的语义分类及属性描述进行全面修订。在双方的积极努力下,项目进展得非常顺利。目前,词典规模已达到 6.6 万余词条,同时语义属性描写质量有了显著提高。在一个汉英机器翻译系统中的实际应用表明,新版本的 SKCC 可以为句义分析、词汇歧义消解提供更全面的语义知识,有效地

9、提高翻译精度。2 现代汉语语义词典的内容概要2 .1 规模与结构语义词典(SKCC)原有词条 48,835 个,它们全部来自于北大计算语言学研究所开发的现代汉语语法信息词典 (5 万词版) 。但 1999 年,后者的规模已由 5 万词扩充到了 7 万词 2,此后的继续改进又使得属性信息的质量有了很大提高 2。相比之下,语义词典却仍然停留在原来的水平上,无论数量还是质量上,二者都已不太协调,不能满足与语法词典配套使用的实际需要。SKCC 的二期工程及时吸收了语法信息词典的最新成果,对原有的 “词语” 、 “词类” 、“同形” 、 “拼音” 、 “兼类” 、 “备注”等字段进行了统一检查、修订,而

10、且增加了 14,663 个名词、动词、形容词,以及 1993 个区别词、时间词、处所词、方位词、副词、数词。现在语义词典 SKCC 的规模比原来增加了 1.8 万词语,达到了 6.6 万余条 2。词典采用 Microsoft Forxpro 中文版 6.0 数据库实现,其中包含全部词语的总库 1 个,每类词语(实词)各建一库,计 11 个。每个库文件都详细刻画了词语及其语义属性的二维关系。比如,总库中包括词语、拼音、同形、义项、释义、语义类、词类、子类、兼类等8 个属性字段。名词库设 15 个属性字段,动词库设 16 个属性字段,如此等等(见表 1) 。2它们均是从北京大学计算语言学研究所开发

11、的现代汉语语法信息词典 (2002 版) 3中直接继承而来。这不仅保证了语义词典收词的规范性、注音与词性标注的准确性,而且也使得它可通过“词语、词类、同形”3 个关键字段与语法信息词典进行链接,相互配合使用,从而使计算机获得更完备的语法、语义信息。现代汉语语义词典规格说明书 - 3 -3库 名词条 属性字段名 词 37522 15时间词 567 15处所词 185 15方位词 204 15代 词 236 15动 词 21142 16形容词 3827 15区别词 753 15状态词 997 15副 词 997 11数 词 109 11总 库 66539 8表 1 语义词典 SKCC 的规模所有的

12、库都可以通过“词语、词类、同形、义项”这 4 个关键字段进行链接。这样,12 个库文件构成有上下位继承关系的“树” ,子结点继承父结点的全部信息,如图 1。总库名词库 动词库 形容词库 贷次 Adverb DatabaseNumeralDatabase2 .2 词语的语义分类本词典语义分类的一个基本原则是,分类的深度与广度取决于语法分析的需要,应用语义知识应着重于解决那些仅靠语法规则难以解决的问题。因而语义分类是在词的语法分类基础上进行的,并且只对名词、动词、形容词等实词进行语义分类描述,而那些带有明显标志的、通常用句法形式就可以表示的语义关系,如各类虚词,则不作为语义分类研究的对象。具体分类

13、如下:(1)名词分类1 具体事物(entity)1.1 生物(organism)1.1.1 人(person)1.1.1.1 个人(individual) 1.1.1.1.1 职业(profession):教师 秘书 会计 医生1.1.1.1.2 身份(identity): 华侨 外行 健将 模范1.1.1.1.3 关系(relation):父亲 阿姨 长辈 朋友1.1.1.2 团体(group)1.1.1.1.1 机构(organization):工厂 医院 商店 剧团现代汉语语义词典规格说明书 - 4 -41.1.1.1.2 人群(society):人民 委员会 少先队 团伙 1.1.2

14、动物(animal)1.1.2.1 兽(beast):狗 猪 牛 羊 老虎 豹子 狐狸 1.1.2.2 鸟(bird):鸡 鸭 麻雀 杜鹃 1.1.2.3 鱼(fish):鲤鱼 河豚 鲸 泥鳅1.1.2.4 昆虫(insect):蚯蚓 知了 蟑螂1.1.2.5 爬行动物(reptile):青蛙 乌龟 甲鱼 蛇1.1.3 植物(plant):树 花 草 牡丹 芍药 1.1.3.1 树(tree):白杨 水杉 芭蕉 1.1.3.2 草(grass): 狗尾巴草 含羞草 蒲公英 1.1.3.3 花(flower):牡丹 芍药 杜鹃 映山红1.1.3.4 庄稼(crop):蔬菜 小麦 高粱 棉花 1.

15、1.4 微生物(microbe):细菌 病毒 霉菌1.2 非生物(object)1.2.1 人工物(artifact)1.2.1.1 建筑物(building):别墅 礼堂 会议室 水库 庙1.2.1.2 衣物(clothes):服装 外套 衬衫 裙子 帽子1.2.1.3 食物(food):面包 牛奶 菜 米饭 饮料1.2.1.4 药物(drug):药片 阿斯匹林 酒精 镇定剂 1.2.1.5 创作物(works):论文 书 杂志 文章 油画 电影1.2.1.6 计算机软件(software):操作系统 数据库 程序 软件1.2.1.7 钱财(asset):财产 钱 资金 报酬 罚款 美元 利

16、息1.2.1.9 票据(bill):发票 单据 汇票 支票 包裹单1.2.1.10 证书(certificate):结婚证 执照 毕业证 驾驶证1.2.1.11 符号(symbol):签名 路标 箭头 句号 1.2.1.12 材料(material):木材 钢铁 煤炭 玻璃 水泥1.2.1.13 器具(instrument)1.2.1.13.1 用具(tool):剪子 刀子 钉子 拖把 改锥 1.2.1.13.2 交通工具(vehicle):车 船 飞机 自行车 1.2.1.13.3 武器(weapon):大炮 机关枪 鱼雷1.2.1.13.4 家具(furniture):桌子 椅子 沙发1.

17、2.1.13.5 乐器(musical-instrument):钢琴 吉他 鼓1.2.1.13.6 电器(electricity):电视 空调 电冰箱1.2.1.13.7 文具(stationery):钢笔 橡皮 尺子1.2.1.13.8 运动器械(sports- instrument):足球 单杠1.2.2 自然物(natural object) 1.2.2.1 天体(celestial body): 太阳 月亮 流星 星星1.2.2.2 气象(weather): 云 彩虹 晚霞 1.2.2.3 地理(geography) 1.2.2.3.1 地表物(land):原野 沙漠 山 山洞 陆地1

18、.2.2.3.2 水域物(water): 江 河 湖 海 河流现代汉语语义词典规格说明书 - 5 -51.1.2.2.4 矿物(mineral):煤矿 原油 铁矿1.1.2.2.5 元素(element):金 银 铜 铁 1.1.2.2.6 基本物质(substance):水 土 灰 1.2.3 排泄物(excrement):汗 尿 粪便 奶水 眼泪 1.2.4 外形(shape): 粉末 长方形 圆 窟窿 孔 洞 泡 1.3 构件(part)1.3.1 身体构件(body-part):头 脸 鼻子 嘴 耳朵 头发 血液 骨头1.3.2 非生物构件(object-part):梁 屋檐 车闸 车

19、筐2 抽象事物(abstraction)2.1 属性(attribute)2.1.1 量化属性(measurable): 体积 面积 重量 质量 价格 2.1.2 模糊属性2.1.2.1 人性(property_of_human):胆量 勇气 脾气 作风 2.1.2.2 事性(description_of_event):境况 形势 状态 环节 2.1.2.3 物性(property_of_object):性能 效用 品种 式样2.1.3 颜色(color): 黑色 白色 浅色 素色2.2 信息(information):话 言语 信件 口信 密码 声明 借口2.3 领域 (field ):社会

20、 经济 法律 科学 艺术2.4 法规(rule):法律 条约 协议 制度 规章 合同 协议 条文2.5 生理(physiological_state):瘟疫 疾病 炎症 艾滋病2.5 心理特征(psychol feature)2.5.1 情感(feelings):态度 感情 爱情2.5.2 意识(cognition):意图 幻想 兴趣 主意 见解 2.6 动机(motivation):目的 原因 理由3 过程(process)3.1 事件(event):学潮 球赛 晚会 课 早餐 战争 火灾3.2 自然现象(natural phenomenon) 3.2.1 可视现象(visible phen

21、omenon):火 电 光 风 雨 3.2.2 可听现象(audible phenomenon):声音 雷鸣 风暴4 时间(time)4.1 绝对时间(specific time):宋朝 三国 清代4.2 相对时间(relative time):昨天 当代 古代 今天 5 空间(space)5.1 处所(location):浙江 西湖 黄山 中国 亚洲5.2 方位(direction):东南 前面 之间 途中 高空(2)形容词分类1 事性值:紧急 突然 困难 容易 错误 费时2 物性值 2.1 量化属性值(measurable value):2.1.1 浓度(concentration):浓

22、稀薄 2.1.2 温度(temperature):热 冷 凉爽现代汉语语义词典规格说明书 - 6 -62.1.3 速度(speed):快 慢2.1.4 长度(length):长 短 2.1.5 高度(height):高 矮 低2.1.6 宽度(width):宽 窄2.1.7 深度(depth):深 浅2.1.8 厚度(thickness):厚 薄2.1.9 硬度(rigidity):硬 软2.1.10 湿度(humidity):潮湿 湿润 干燥2.1.11 粗细(degree of finish):粗 细2.1.12 松紧(degree of tightness):松 紧2.1.13 大小(s

23、ize):大 中 小2.1.14 价值(value):贵 便宜2.2 模糊属性值(unmeasurable value)2.2.1 视感(vision):亮 醒目 清晰 混浊2.2.2 触感(tactility):紧 松 粗糙 滑 柔2.2.3 音质(tone): 响亮 低沉 刺耳2.2.4 味道(taste):酸 甜 苦 辣 可口2.2.5 性质(quality):新 旧 真 假 好 坏 强 弱2.2.6 内容(content):空洞 晦涩 清楚 浅显2.2.7 外形(shape): 方 圆 尖2.3 颜色(color):红 黄 蓝 绿 鲜艳3 人性值 3.1 年龄(age):年轻 幼小 老

24、3.2 品格(character):善良 博学 幼稚 优雅3.3 关系(relation):亲密 疏远 热情 冷淡3.4 境况(condition):繁忙 贫穷 危险 疲劳4 空间值 4.1 一维值:远 近4.2 二维值:平 斜 弯4.2 三维值:拥挤 杂乱 整齐 满 壮阔5 时间值:古老 久远 短暂 早 晚(3)动词分类1 静态关系(state):是 有 等于 包括2 心理活动(emotion/ cognition):喜欢 尊敬 反对 同意 怀疑 思考 判断3 动态行为(event)3.1 变化(change):死 病 下降 长高 缩小 变暗3.2 气象(weather):下雨 刮风 打雷

25、起雾3.3 身体活动(bodily care and functions): 蹬 跳 推 笑 咳嗽 游泳 3.4 五官感觉(perception):看见 听到 闻着 品尝3.5 消耗(consumption):吃 喝 饮 3.6 位移(motion):跑 走 散步 飞 过来 回去 拉来3.7 创造(creation):制作 画 炒 写 创建 修筑 3.8 接触(contact):触摸 撞击 打中 系 挖掘 现代汉语语义词典规格说明书 - 7 -73.9 领属转移(possession):买 卖 赠送 给 转让 借 3.10 信息交流(communication):告诉 询问 请求 转达 叮嘱

26、说3.11 比赛(competition):竞赛 赛跑 打仗 摔跤 辩论3.12 社会活动(social behavior):改革 调价 开会 联欢 3.13 其他行为(other event)(4)副词分类1 程度(degree):很 挺 太 顶 更 最 极 十分 非常 稍 稍微 略微2 范围(range):都 也 总 共 一共 总共 统统 只 就 光 仅 仅仅3 时间(time):正 刚刚 就 先 曾经 已经 终于 立刻 马上 永远 4 处所(location):到处 处处 暗中 当场 当面 5 频度(frequency):常常 常 时常 又 再 还 重新 重 6 方式(manner):

27、渐渐 逐渐 挨次 挨个 逆时针 慢慢7 否定(negation):不 没有 没 未 莫 休 勿 别8 语气( modality):却 可 倒 竟 也 就 偏偏 偏 都 简直 索性 幸亏 难道 到底 究竟 也许 或许 大约 大概(5)数词分类1 基数(cardinal number)1.1 系数:一 二 两 三 五 六 七 八 九 几 1.2 位数:十、百、千、万、亿、万万1.3 概数: 多半 多少 若干 很多 许多 好多 好几 好些 无数2 序数(ordinal number):第一 第二 第十3 数量(amount):一切 许多 很多 不少 大量 部分 全部 所有 俩2 .3 词语的语义属性

28、描写分类法刻画事物固然简洁、清晰、反映了词语最基本的语义信息,但信息颗粒度较大,属于同一语义类的词语仍可能各具特点。如:表示“动态事件”的动词,其动作的发出者(主体)则可能完全不同, “唱戏”的主体是“人” , “产卵”的主体是“动物” , “抽穗” 的主体是“植物” , “涨潮” 的主体是“自然物” 。又如 “害羞、繁茂、肥沃、甘甜”虽然都是“性质” 类形容词,但其所能修饰的名词性成分也是不同的:“害羞” 用于指“人” ,“繁茂” 指“ 植物” , “肥沃” 指“自然物” , “甘甜” 指“可食物” 。 因此,为了进一步提高机器翻译系统或其他自然语言处理系统的性能,语义词典还要在分类的基础上

29、,依靠属性描述来刻画每一个词语与周围名词性成分所发生的语义组合关系。3 各类词库的共同字段以下说明中,左边的一列楷体汉字代表字段名,中间的一列数字表示各个字段所占的字节数。右边的词语则是对字段值的说明。词语 8 暂收 14 个字的词语同形 2 词典中同形词(即汉字相同的词) 的情况是很复杂:现代汉语语义词典规格说明书 - 8 -8不同词条:抄写的“抄” ,抄近道的“抄” 。同类同一词条的不同义项:“去北京”的“去” , “去果皮”的“去” 。同音不同类:属连词的“和”与属介词的“和”是不同的词,动词的“锁”与名词的“锁”也是两个意义有联系的不同的词;属广义兼类现象。 “同等”兼属区别词与副词,

30、仅因同字为语法功能不同,两者的意义并无区别,这是狭义兼类现象。 同类:和稀泥的“和”(huo4),和一盘棋的“和”(he2)。表示加在一起的“合计”(he2ji4),有磋商、盘算意思的“合计”(he2ji5)。不同音不同类:属连词的“和”(he2),与属动词的和稀泥的“和”(huo4)。 在词典中,除了“同字同音同类”的情况外,上图中同形词的其他情况均作为不同记录收入词典。为了进一步区分同字同音同类的情况,专设了一个“同形”字段。对于同字、同音、同类但是应算不同词项的情况,在“同形”字段中填上字母 A,B,C 等。对于同字、同音、同类、同一个词的不同义项的情况,在“同形”字段中填上数字 1,2

31、,3 等。为了提高同形词的处理效率,在“同形”字段中也用 A,B,C 等标识同字同类不同音的情况。总之, “同形”中的 A,B,C 等表示不同的词,数字1,2,3 等表示同一个词的不同义项。当需要字母与数字并存时,则将字母置于数字之前,如 A1,A2,B1,B2 等。拼音 24 填每个词语的汉语拼音,声调用 “1,2,3,4,5”表示,其中“5”表示轻声。如:“常识”的全拼音是“chang2shi2” , “尺子”的全拼音是“chi3zi5”。词类 2 填词语所属词类的代码。如:名词填“n” ,动词填“v” ,形容词填“a” 。子类 2 填词语所属词类的子类代码。如:名词性成语填“IN” ,动

32、词性习用语填“LV”。兼类 4 填该词语兼属的词类代码,如:名词“锁”的兼类填“v” ,动词“锁”的兼类填“n” 。义项编码 对“同形”字段相同的词条进一步加以区分,填上不同的义项编码,如“菜做得很清淡”中的“清淡”在本字段填“1” , “生意清淡”中的“清淡”则填“2” 。义项 10 填写该词语的简明释义,如:词典中收录了两个 “天才” ,为了让人更为方便地将其区分开,就分别在本字段填上“人”和“智慧” 。即前一个“天才”指人,比如可以说“他是一位数学天才” ,后一个“天才”指“智慧” ,可以说“他在数学方面很有天才” 。语义类 20 填写该词语的语义类别名称。意义明确的尽量填低层的小类;意

33、义难以把握的可酌情填上层语义类。可以不止填一个类别名称,不同的名称之间用“/”隔开。如“校长”填“身份” , “刀”填“用具” , “青菜”填“植物/食物” ;“是”填“静态关系” , “喜欢”填“心理活动” , “打雷”填“气象” 。WORD 40 填该词语对应的英语译词或短语,如: “安静”在本字段填“quiet” , “脏乱”填“dirty and messy” 。Ecat 40 填该词语的英语译词的词性代码,或短语组成结构,如:“安静” 在本字段填“A” , “脏乱”则填“!A+C+!A”(!表示中心词)。备注 20 填写词语某些用法的简明示例或说明,用 “”代替该词,各示例之间用斜现

34、代汉语语义词典规格说明书 - 9 -9道“/”隔开。注:除了“语义类、义项编码、WORD、 Ecat”4 个字段外,上述其他字段均直接从北京大学计算语言学研究所的现代汉语语法信息词典中直接继承而来。4 名词库字段(时间词、处所词,以及名词性的成语、习用语、简称略语等库与此相同)配价数 2 一价名词填“1” , 二价名词填“2” ,零价名词不填。名词的配价表现为支配性名词要求语义上受其支配的从属名词与之共现。要求一个从属名词与之共现,配价数为 1。如“老李的女儿回来了/ 小坡的爸爸病了”着两句话中的“女儿、爸爸”都是一价名词。因为,从意义上看,它们在表示某事物的同时,还隐含了该事物跟另一个事物之

35、间的某种依存关系。当它在语句中出现时,它要求支配其配价成分。这也就是说,一价名词“女儿、爸爸”不仅是句法上的中心词,而且是语义上的支点,因而在句子中不能省略。如:“老李的女儿 *老李的” 、 “小坡的爸爸 *小坡的” 。而一般名词(零价名词)则可以省略,如:老李的拐杖 老李的小坡的书包 小坡的要求两个名词性成分与之共现,配价数为 2。如:“这件事老李有意见/ 他对刘刚一直没有好感” ,这里的“意见、好感”都是二价名词。从语义上看,“意见、好感”一般是某人针对某人或某物的,涉及到两个个体。因而,在句子中要求两个配项与之共现,如果其中一个配项不出现,那么句子的语义就不完整,如:“老李有意见 / 他

36、一直没有好感” 。 汉语中绝大多数名词并不一定要求有任何配项与之共现,如“天下雨了/ 桌子坏了” , “天”和“桌子”就都是零价名词,它们在本字段均不填。参照体 20 填写一价和二价名词的参照体的语义类名称。零价名词在本字段不填。如“女儿” 、 “看法”的本字段填“人类” , “桌子”则不填。对象 20 填写二价名词的对象的语义类名称。如“意见”在本字段填上“人类/事件” 。一价和零价名词本字段不填。在句子中,名词的对象一般可以用“对、对于”等介词标记出来,如“群众对他的意见很大”中的“他” 。直接上位 20 填写该名词的直接上位概念。如“雨鞋” 、 “皮鞋”在该字段均填“鞋” ;“轿车”在本

37、字段填“车” 。5 动词库字段(动词性的成语、习用语、简称略语等库与此相同)配价数 2 一价动词填“1” , 二价动词填“2” , 三价动词填“3” 。本词典引进“配价”概念来说明一个动词能支配多少名词性成分。从理论上说,在一个句子中,直接受谓语动词支配的名词性成分不得超过 3 个:主语、宾现代汉语语义词典规格说明书 - 10 -10语 1、宾语 2。动词能支配几个名词性成分,它就是几价动词。如果能支配 1个名词性成分,则为一价动词(如“奔跑、出差、劳动、前进、病、失败”等) ;如果能支配两个名词性成分,则为二价动词(如“搬、穿、发明、制定、听见、遗失、是”等) ;如果能支配 3 个名词性成分

38、,则为三价动词(如“给、给予、问、回答、借、送给”等) 。配价是从静态的角度依据动词的词汇意义确定的,因此,就某个具体的动词而言,其配价是相对稳定的。此外,动词同配价成分之间的组合应该是有意义的、可理解的。在“他跑了一身汗”这个句子中, “跑汗”是无意义的。因而就可以判断出“汗”不是“跑”的配价成分, “跑” (义为“快速前进” )的配价成分只是主语“他” ,是 1 价动词。因此, “跑”的本字段填“1” 。需要特别说明的是,汉语中有些动词可以看作没有配价成分,像“例如、可见、天亮” 。它们的配价数定为 0,本字段不填。主体 20 填写动词的主体所属的语义类名称。如“逃跑”在本字段填“人类/动

39、物” ,“刮倒”填“气象” , “死”填“生物” 。主体(agent)是动词的配价成分承担的一种语义角色,指动作行为(或状态)或自然现象的发出者。如:“敌人逃跑了 / 风刮倒了大树”中的“敌人、风”。 在句子中,主体一般占据主语位置,但有时也可处于宾语位置,如“死了一只兔子”值的“兔子” 。为了尽可能详细地描述主体的语义限制,本字段还引入了以下几种符号 3:“/”表示“或” ,如“叙述”的主体填“人类/作品” ;“”表示“非” ,如“越冬”的主体填“生物人类” ;“” (双引号)表示具体词,引号中的“*”表示任意汉字串,如“晒”在本字段填“太阳” , “吹拂”填“*风” 。客体 20 填写二价

40、和三价动词的客体语义类名称。如“擦”在本字段填“人为事物/构件” , “画”填“作品” , “丧失”填“抽象事物” 。客体(object)也是动词的配价成分承担的一种语义角色,指动作行为或变化所涉及的直接对象。如“擦玻璃 / 画了一幅画儿”中的“玻璃、画” 。在句子中,客体一般占据宾语位置,但在受事主语句或被动句中则处于主语位置,如“玻璃被擦过了 / 画儿画好了 ” 。与事 20 填写三价动词的与事所属的语义类名称。如“给”在本字段填“人类” , “送”也填“人类” 。与事,指事件中有利害关系的间接客体,如受益者或受损者。如“给他一本书 / 送我 30 元钱”中的“他、我” 。在句子中,邻体一般占据间接宾语位置,但在主谓谓语句、受事主语句或被动句中则处于一般宾语位置,如“那本书小李给他了/ 那本书给他了/ 那本书叫小李给他了” 。 6 形容词库字段(状态词、区别词,以及形容词性的成语、习用语、简称略语等库与此相同)配价数 2 一价形容词填“1”,二价形容词填“2”。在句子中,只要求一个名词性成分与之共现,配价数为 1,如“大雨 / 花很红”3这 4 种符号的定义同样适用于本词典动词库中的“客体、与事”字段以及名词库和形容词库中的“参照体” 、 “对象”及“主体”等字段。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 1

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。