1、1Word 2007 中藏文排序的研究摘要:藏文文字的排序是藏文信息处理领域的一项不可缺少的关键所在。也是一直以来有待解决的问题。目前,word 成了最广泛的应用程序之一,如果 word 中实现符合藏文文字结构特点和语法规则的藏文排序,将会为以后藏文研究工作者带来很大方便。 关键词:藏文排序;结构;排序;word 1. 藏文字与文法规律 目前,藏文是藏文民族在日常生活中所使用的书面文字之一,它属于拼读性文字,由 30 个辅音字符和 4 个元音字母组合而成,其中,辅音字母是分为八组,每组四个字符,最后一组两个字符。四个元音中三个加在辅音字母(或上加字)上面,一个加在辅音(或下加字)下面。藏语的发
2、音跟其他语言有所不同,发任何一个音都附带一个辅音“a” ,在书写中为了方便等原因略写了后加字“a” ,除了辅音和元音字母外,还有标点符号,藏文的标点符号没有汉语的那么丰富,常用的符号有“分界符() ”和“分隔符(?) ”两种,其中分界符是每一个完整的句子后面或者前半句和后半句连接处,一般情况下,文章的结尾会放两个分界符表示此文以结束,有些文章的结尾也有四个分界符的情况。分隔符是藏文中特别重要的符号,每一个藏文字都是以分隔符来隔开的,这个跟英文中每一个单词间用空格符隔开相似。藏文也有数字符号,用法跟阿拉数字一样,写法上有些差别。 2辅音中分割 10 个后加字母,5 个前加字母,2 个又后加字母,
3、以及3 个上加字和 4 个下加字的情况下表 1 由此不难看出,10 个后加字外其余的 20 个辅音字母不能相互搭配,如:这种不符合后加字规律会出现错误。10 个后加字中分割了 5 个前加字和 2 个又后加字。3 个上加字是后加字中最后 3 个字母。两个又后加字字可以加的后加字共有 3 个,分别是。现在藏文字中一般很少写。字可以加的后加字共有 4 个,分别是。现在藏文字中一般很少写。3 个上加字和 4 个下加字与辅音字母固定搭配已确定。其中,字可以加在基字之上的共有 12 个,字可以加在基字之上的共有 10 个, 字可以加在基字之上的共有 11 个。 1)前加字和辅音字母之间的固定搭配规律如下:
4、 2、藏文结构 藏文文字的结构是 30 个辅音字母和 4 个元音字符相互组合而成的。藏文文字的基本结构各不相同,至少 1 个辅音字母,最多的 7 个(6 个辅音字母和 1 个元音字母组成,其中元音字母加在结构中基字的上方或下方)构件构成。但现在受语法影响也有双后加字或双元音的藏文文字结构。不管是怎么样的结构都以一个构件字为核心而成,称之为“基础字”简称“基字” ,也是藏文字中唯一不可或缺的构件。其余的字母都以基字的前面的称(“前加字” ) ,加在基字后面的(后加字) ,最后(又后加字)和元音字符组合一个完整的藏文字的结构(图 1) (注:此处的元音只能出现一处) 。藏文文字具备纵向结构和横向结
5、构的非线性结构的文字,纵向结构具有前加字、基字、后加字、又后加字的先后顺序成线性结构,3纵向结构具有元音、上加字、基字、下加字(元音最上面或下面)上下叠加的结构特征,所以藏文字是结构上十分复杂的文字。 完整的藏文字结构藏文字的构造序和拼写上有区别的,其中拼写序是拼写藏文字时符合从左到右、从上到下规则的书写顺序或拼读顺序。 藏文文字构造的顺序是按照基字、前加字、上加字、下加字、元音、后加字、又后加字。每一个构件是一个层次,基字居于核心层,又后加字在最外层。每一级字符按字符序循环,每次一次构件发生一次字符序变换,整个循环条件不变又从最低构件开始新的循环。总之,各个构件上的字符以基字为中心,按照循环
6、构造序顺序变换,知道这个循环完了,基字开始更换,依次重复这种循环的同时构造排列和字符交替而形成了多个以基字为中心的循环集,所有的藏文字就在这个循环中定位。 在藏文文字排序的时候发现几个问题,第一、藏文基字判断上出现歧义性,如等藏字的第一个可以是基字也可以是前加字,所以这种情况应该在算法中加入规则来解决;第二、在藏字中有双后加字的存在,如这种情况把双后加字都放在一个排序单位当中来排序。 3、word 2007 中实现藏文的排序的开发环境与步骤 Word 2007 中对藏文排序的开发和系统的运行有着紧密的关系,整个word 2007 中对藏文排序时采用 Microsoft Visual Studi
7、o 2010 平台上用 Visual Basic 2010 语言编程。 具体步骤如下:1)获取选定的表格;2)获取需排序的数据;3)对数据中的字分解成字符序列;4)对字符序列排序;5)排序结果存入选定的表格中。 (作者单位:青海民族大学计算机学院) 4参考文献 1黄鹤鸣,达飞鹏. 基于排序的现代藏文音节判定J. 计算机应用,2009(7). 2黄鹤鸣,赵晨星.引入排序码实现藏文字符的排序J. 计算机技术与发展,2008(10). 3黄鹤鸣,赵晨星.基于 DUCET 的藏文排序方法J. 中文信息学报,2008(7). 4江荻,等.论藏文的序性及排序方法J.中文信息学报,2000,14(1). 5林河水,等.一种符合 ISO14651 语义的藏文排序实现方法J.中文信息学报,2006,20(2). 6扎西次仁.藏文的排序规则及其计算机自动排序的实现J.中国藏学,1999(4). 7珠杰,欧珠.基于藏文编码 GB 的藏文排序方法研究J.西藏大学学报:自然科学版,2008,23(1). 8东噶洛桑赤来.东噶藏学大辞典M.中国藏学出版社.2002.4 9新编藏文字典M.青海民族出版社。1989.6 注解 多吉杰布,藏文文法知识. 西藏人民出版社.2005 年 7 月.