1、人类语言概要,赵 海上海交通大学 计算机科学与工程系,2,语言类型分类,孤立语(词根语)孤立语的特点不是通过词的内部形态变化来表达语法作 用,而是通过虚词和词序来表达。汉语、彝语、壮语、苗语、越南语都是孤立语。黏着语黏着语有词的形态变化,语法关系通过词的形态变化来表示。黏着语的每个形态只表示一种语法意义,每种语法意义总是用同一个形态来表达。土耳其语、维吾尔语、芬兰语、匈牙利语、日语、朝鲜语都是黏着语。乌拉尔语系和阿尔泰语系下的语言是黏着语。屈折语在屈折语中,每个构型形态可以同时表示几个语法意义,每个语法意义又可以用几个构型形态来表示。在这里,词根的 重要性突出,而且词根结合处往往发生语音变化。
2、印欧语系和闪-含语系下的很多语言都是屈折语。多式综合语(编插语)许多美洲原住民语言属于多式综合语。(Chukchi) 以下为两个复合词 的例子ta-meynga-levta-part-arkan(直译语意第一人称大头痛整体语意我头痛得厉害。)man-nake-ure-qepl-uwicwen-mak(直译语意让我们(宾格) 晚长球玩我们(主格)整体语意让我们今晚打一晚的球。),3,语言类型分类,语言的句法分类分析语(汉语、英语、法语、保加利亚语)仅包括孤立语。 综合语(Synthetic language)(日语、俄语、德语、印地语)包括屈折语、黏着语和多式综合语。,4,语言系属分类,语言系属
3、分类是指根据语言的 发展和演变、直接而明显的关联,对语言进行归类的方法。 语言系属分类主要依据语言语音、词汇、语法规 则之间某些对应关系,把具有相似的语言归于同一类语群,这种语群称为同族语言即“语族”;按“语族”之间的某些对应关系,又归在一起,这类同类语族称为同 系语言即“语系”。现今全世界现存的语言接近7000种,根据系属分类的方法,将语言分为若干个语群,每个语群中的语言可以直接或间接反应语言分化与进化,而同类语群 的语言是由一个祖语(母语言)演变而来的。语言系属分类法采取“祖语”作为前缀,其分支链接下来,图标图表类似一个系谱表。在中文的语境里, 对世界诸语言的分类,有“语系”、语系下面的“
4、语族”,较大语族下面衍生出语言支系(或简称“语支”),最后 就是具体语言,最多达到四个层次。但实际上,语言的分支比这往往更复杂,所以有时亦因利乘便的把分类再细分为“亚语族”、“亚语支”等分类。有人提出在语 族和语支之间增设“语群”,在语支和语言之间增设“语组”或“语团”。,5,语系,以母语使用人口排列 1. 印欧语系(欧洲、北美洲大部份地区、西南亚到南亚) 2. 汉藏语系(东亚) 3. 尼日尔-刚果语系(撒哈拉以南非洲) 4. 亚非语系,旧称闪含语系(北非到非洲之角、西南亚) 5. 南岛语系(大洋洲、马达加斯加、东南亚) 6. 达罗毗荼语系(南亚) 7. 阿尔泰语系(中亚,有争议,有说法为突厥
5、语族和日本语系分别为第7和第8位) 8. 南亚语系(东南亚) 9. 壮侗语系(东南亚) 10. 乌拉尔语系(北亚到北欧),6,语系,以民族语:全世界的语言“Ethnologue”分类,种类最多的15个语系如下: 1. 尼日尔-刚果语系(1,532种语言) 2. 南岛语系(1,257种语言) 3. 跨新几内亚语系(477种语言)(种类有争议) 4. 汉藏语系(449种语言) 5. 印欧语系(439种语言) 6. 亚非语系,旧称闪含语系(375种语言) 7. 尼罗-撒哈拉语系(204种语言) 8. 帕马-恩永甘语系(178种语言)(种类有争议) 9. 奥托-曼格语系(174种语言)(数量有争议,L
6、yle Campbell认为只有27种) 10. 南亚语系(169种语言) 11. 塞皮克-拉穆语系(100种语言)(种类有争议) 12. 壮侗语系(92种语言) 13. 图皮语系(76种语言) 14. 达罗毗荼语系(73种语言) 15. 玛雅语系(69种语言),7,8,9,印欧语系,历史针对亚欧各种不同的语言,18世纪威廉琼斯爵士首先提岀“原始印欧语”的存在。他发现当时欧洲人已知最古老的语言其中四种拉丁语、希腊语、梵语和波斯语之间有相似之处。后来19世纪初德国的弗朗兹葆朴对此理论进行了系统的论证。19世纪时,学者通常将这系语言称为“印度-日耳曼语系”,有时候也叫“雅利安语系”。但后来人们逐渐
7、发现欧洲大多数语言与此都有关联,名称也转变为印欧语。一个明显的例子是:梵语和立陶宛语及拉脱维亚语的古口语方言之间有很强的相似性。这些语言共同的假想祖先称作原始印欧语。关于这个语言的起始地(Urheimat),今日的学者同意两种说法:一是黑海和里海北方的干草原(见库尔干),二是安那托利亚。支持库尔干假说的将这种语言的时间推算在公元前约4000年左右;支持安纳托利亚假说的将时间要再往前推好几千年(见印度-赫梯语)。语言特点印欧语系各语言原来都是屈折语,原始的印欧语的名词有3个性,3个数和8个格的变化(例如俄语这个特点保存得比较完好);广泛利用词缀和词干元音音变来表达语法意义;名词和大部分形容词有格
8、、性和数的变化;动词有时态、语态和语体的变化,主语和动词在变化中互相呼应。另外,印欧语系各语言的词都有重音。但是许多语言,例如英语形态已经简化,转向了分析语。,10,11,12,印欧语系,分类日耳曼语族意大利语族衍生出罗曼语族凯尔特语族波罗的语族斯拉夫语族印度-伊朗语族希腊语族阿尔巴尼亚语族亚美尼亚语族安那托利亚语族吐火罗语族未分类,13,印欧语系,14,非印欧语系的欧洲语言,大多数欧洲语言属于印欧语系,也有一些独立在外。 乌拉尔语系:包括匈牙利语、爱沙尼亚语、芬兰语和萨米语(拉普语)。 高加索语系 巴斯克语:孤立。 伊特鲁里亚语:孤立,已消亡。马耳他语和土耳其语也是今日欧洲的语言,但起源不在
9、欧洲,马耳他语大部份继承自阿拉伯语,土耳其语则属于阿尔泰语系突厥语族。,15,汉藏语系,范围和争议关于汉藏语系的分类和归属问题,学界争论不休。在中国,汉藏语系一般分为四个语族,即汉语族、壮侗语族(或称侗台语族、侗泰语族、台语族)、苗瑶语族和藏缅语族。西方学者一般认为苗瑶语族和壮侗语族不属于汉藏语系。法国学者沙加尔还提出汉藏语系和南岛语系有发生学关系,这个理论得到中国著名语言学家邢公畹的赞同。近来叶尼塞语系也被认为和汉藏语系有关。有少数学者,如克里斯托弗贝克威思(Christopher Beckwith)和罗伊安德鲁米勒(Roy Andrew Miller)不承认藏缅语和汉语有发生学关系。,16
10、,汉藏语系,汉藏语系中各语言的一些类型学的特点: * 很多是孤立语; * 有声调; * 单音节词根占多数; * 有量词; * 以虚词和语序作为表达语法意义的主要手段。但是,大部分语言学家认为,原始汉藏语的语音和语法和嘉绒语相似:没有明确的声调系统,有复辅音,有复杂的动词形态。法国学者奥德里库尔(Haudricourt)早在1954年发现汉语的声调是后起的,战国时的汉语没有声调,到了南北朝韵尾-s和喉塞音分别演变成去声和上声。上古汉语也有复杂的形态。嘉绒语和藏语里存在着同样的s-使动前缀。按照历史语言学的定论,声调的有无、语序(动词、主语和宾语的相对位置)、音节结构等类型特征无法支持或者否认语言
11、同源关系的假设,因为这些特征容易扩散到不同的语系。惟有共同的形态成分(前缀、后缀、中缀、元音交替等)和基本词汇才能证明这种关系。,17,18,汉藏语分类历史,德国学者克拉普罗特(Julius Klaproth)早在1823年就提出汉语、藏语、缅甸语的基础词汇之间有同源关系,而泰语和越南语则不同。但后来他的著作被淡忘了,一直到20 世纪,学者们才重新重视他的研究。19世纪流行的分类,一般都是出于人种的考量,例如内森布朗(Nathan Brown)在1837年提出“印度支那语”的概念,用来表示除阿尔泰语和达罗毗荼语以外的所有东方语言,包括日语和南岛语。“汉藏语”一词是普祖鲁斯基(Jean Przy
12、luski)在1924年提出的,他的分类如下: * 藏缅语 * 汉台语(这里的台语不仅包括现在所说的侗台语,还包括苗瑶语)在此基础上,有人把汉语、侗台语和苗瑶语分开,这种分类在中国比较流行: * 汉语 * 藏缅语族 * 壮侗语族 * 苗瑶语族20世纪后期,多数西方学者从汉藏语中排除了侗台语和苗瑶语,但是保留了汉语和藏缅语的二分法,例如马蒂索夫(Matisoff)、布拉德利(Bradley 1997)、杜冠名(Thurgood 2003)的分类: * 汉语 * 藏缅语族目前有学者不认同这种二分法。更有人认为汉语在汉藏谱系树的地位可能比较接近藏语,反而汉语和缅甸语或者羌语的关系没有那么密切。例如V
13、an Driem(2001)就把汉语和藏语并称汉藏语族,作为藏缅语系的一个分支。,19,汉藏语系,# 1 汉语族# 2 藏缅语族 * 2.1 白语 * 2.2 喜马拉雅语群 * 2.3 萨尔语群 * 2.4 克伦语支 * 2.5 库基-钦-那加语言 * 2.6 缅彝语群 * 2.7 梅泰语 * 2.8 米基尔语 * 2.9 Mru * 2.10 达尼语支 * 2.11 格曼语支 * 2.12 侬语支 * 2.13 党项-羌语群 * 2.14 土家语 * 2.15 西吐蕃 * 2.16 Hruso * 2.17 未分类的藏缅语族语言,20,亚非语系,亚非语系,又称非亚语系、非洲-亚洲语系或阿非罗
14、-亚细亚语系,旧称闪含语系或闪米特-含米特语系,主要分布在亚洲西部的阿拉伯半岛和非洲北部。亚非语系旧称闪含语系或闪米特-含米特语系,是从圣经的传说中,挪亚的两个儿子的名字来源的,圣经说他的儿子闪是希伯来人和亚述人的祖先,另一个儿子含是非洲人的祖先。亚非语系主要的共同特征是: * 是一种屈折语 * 辅音除了有清辅音和浊辅音外,还有一种重辅音,是在口腔后部和喉腔形成的 * 动词有人称前缀 * 有格和性的区别,但比印欧语系简单 * 词根基本由辅音组成,21,22,23,亚非语系,* 柏柏尔语族 o 东柏柏尔语支 o Guanche语支 o 北柏柏尔语支 o 塔马舍克语支 o 哲纳加语 * 乍得语族
15、o 比乌-曼达拉语支 o 东乍得语支 o Masa语支 o 西乍得语支 + 豪萨语、豪撒语 * 库希特语族 * 埃及语族 o 埃及语(已灭绝) o 科普特语(已灭绝) * 奥摩语族 o 北奥摩语支 o 南奥摩语支,* 闪米特语族 o 东闪米特语支 o 中闪米特语支 + 亚拉姆语 + 图罗尤语 + 曼底安语 + 古典叙利亚语 + 阿拉伯语 + 马耳他语 + 古希伯来语 + 希伯来语 + 撒马利亚语(已灭绝) o 南闪米特语支 * 未分类 o Birale,24,南岛语系,所谓的“南岛”(Austronesia),是1899年由学者Wilhelm Schmidt自拉丁文字的字根“auster”与希
16、腊文“nsos”所合组而成,前者为南风之意,后者意指岛,所以日本语将“Austronesia”翻译成“南岛”。中文在近代沿用了这个日本语词汇使用南岛语系的区域包括台湾、菲律宾、婆罗洲、印尼、马达加斯加、新几内亚、新西兰、夏威夷、密克罗尼西亚、美拉尼西亚、波利尼西亚等各地岛屿的语言,外加马来半岛上的马来语、中南半岛上越南与高棉的占语和泰国的莫肯语(Moken/Moklen)。北起台湾,南抵新西兰,西至马达加斯加,东至智利复活节岛。南岛语系分布的区域很广,语言的数目也颇多,根据民族语(Ethnologue)世界语言数据库的资料,其总数有1262种之多(Ethnologue: Languages o
17、f the World 2004)。由于移民及近代帝国主义殖民,在划分为南岛语系的区域内,部分的岛上也有使用非南岛语族的语言。以台湾为例,除了有隶属于南岛语族的平埔族语言和高山族语言以外,由于17/18世纪明、清朝移民及19世纪日本殖民,同时存在着不同的汉语,比如说闽南语和客家话及日语。其他如菲律宾相继受到西班牙、美国殖民、夏威夷受到美国殖民、澳洲/新西兰受英国殖民、印尼受到荷兰、马来西亚受到英国殖民、越南高棉受到法国殖民等.其殖民母国的语言仍造成不同影响存在其现今语言系统内。,25,南岛语系,根据民族语的分类,南岛语系可以再分为两大次语系,第一是“台湾原住民语”(Formosan langu
18、ages),第二为“马来-波利尼西亚语”(Malayo-Polynesian languages)。前者有23种语言,可以再分成泰雅语(Atayalic)、排湾语(Paiwanic)、和邹语(Tsouic)三大系统。后者则有1239种语言,可以再分成“中东部马来-波利尼西亚语”(Central- Eastern Malayo-Polynesian)、“西部马来-波利尼西亚语”(Western Malayo-Polynesian)、以及两种尚无法归类的语言。关于“南岛语”(Austronesian languages)和“马来-波利尼西亚语”(Malayo-Polynesian language
19、s)的关系,还有其他的说法。其说法是“南岛语”有十种次语系,其中有九种是在台湾,最后一种则是“马来-波利尼西亚语”。也就是说,虽然其分类方式和民族语所列举的并不一致,但一样是将“马来-波利尼西亚语”当成是“南岛语系”的一个次语系。观点台湾中央研究院(1996):“南岛语系(Austronesian)又称马来-波利尼西亚语系(Malay-Polynesian),是世界上唯一主要分布在岛屿上的一个大语系”。中央研究院平埔文化资讯网:“生活在台湾的土著民族,即平埔族和高山族,他们所使用的语言,不仅自己相互之间有很深的关系,而且跟太平洋、印度洋岛屿上的许多种语言都有亲属关系,形成学术界所称的“南岛语族
20、” (Austronesian) 或 (Malayopolynesian)”。,26,27,达罗毗荼语系,达罗毗荼语系(Dravida,又称德拉维达)分布在印度南部和西部的泰米尔纳德邦、卡纳塔克邦、安得拉邦、喀拉拉邦西孟加拉邦和巴基斯坦的一个小地区,包括75种语言,其中马拉雅拉姆语、泰米尔语、泰卢固语、卡纳达语被认定为官方语言。泰米尔语也是斯里兰卡和新加坡的官方语言。他们的语言在信德省,俾路支斯坦,阿富汗也找得到。,28,阿尔泰语系,阿尔泰语系,Altaic languages,包括60多种语言,说该语系语言的人口约为2.5亿,该语系主要集中于中亚及其临近地区,语系主要由各个时期的入侵者带来的
21、语言和当地语言互相融合形成。“阿尔泰语系”主要有突厥语族、蒙古语族、通古斯语族和韩日-琉球语族(具争议) 四个分支。有的语言学家把阿尔泰语系和乌拉尔语系划分为一组语群即乌拉尔-阿尔泰语系。以上代表的是20 世纪初芬兰语言学家Ramsted和现代俄国语言学家Starostin等学者的看法。突厥语族、蒙古语族和通古斯语族的共同特征很多,无论这些是同源关系的证据还是民族交流的结果。,29,阿 尔泰语系的存在争议,阿 尔泰语系的存在争议阿尔泰语系的存在与否,至今依旧有争议,有的语言学家认为突厥语族、蒙古语族和通古斯语族三种语族之间没有同源关系,这些反对阿尔泰语系的学者认 为,这些语族虽然有许多相同的语
22、法特点和共同词汇,但是这些是因为民族长期接触,互相融合而产生的,是借用的结果,而并不是原始语遗留下来的原始特征。一 般认为是蒙古语借用突厥语的词汇和语法形态。目前这个问题还在议论之中。,30,日 本语、朝鲜语的归属争议,第一类观点认为日语属于阿尔泰语系,因为日本语有着非常显著的阿尔泰语系的语言特征。 * 流音不会出现在本土词汇(固有词)的首个音节上 * 元音和谐律(或称元音调和) * 黏着语的特征日语的这三个语言特征为该观点提供了相当有力的支持。但是日语跟阿尔泰语系的其他语言之间的同源词汇却非常少,反对该观点的学者一般都以此作为反驳的力证。元音和谐也并非阿尔泰语系的专利,楚科奇-堪察加语系的楚
23、科奇语也存在元音和谐现象,此外非洲尼日尔-刚果语系的许多语言,包括多威语、伊博语和许多班图语族的语言,亦有着以舌根位置为基础的元音和谐的现象存在。黏着语的特征不止阿尔泰语系有,在其他语系中也存在,例如乌拉尔语系的芬兰语、匈牙利语;达罗毗荼语系的泰米尔语,这些语言也是典型的黏着语。第二类观点认为日语跟朝鲜语共属于一个新的语系。持该观点的学者认为、日语的文法与朝鲜语的文法有惊人的相似度、都是使用主宾谓序列、两者历史上又共同受过古汉语的影响、因此有学者认为日语跟朝鲜语是阿尔泰语系和汉藏语系混合的新语系。但是日语跟朝鲜语之间缺乏同源词也成了异议的学者们反驳该观点的力证。第三类观点认为日语跟琉球语共属于
24、一个新的语系,即日本语系。由于日语跟琉球语之间确有不少相似性,故此观点得到了一些学者的支持,但仍然并没有被广泛认同。第四类观点认为日语跟朝鲜语一样,都是孤立语言,而它们跟目前世界上已知的语系都没有关联。持该观点的学者们以“同源词问题”支持该观点。第五类观点认为日语应当归属汉藏语系藏缅语族,主要以西田龙雄为代表的一些日本学者,认为日语的语序与缅甸语相同,而且也有与缅甸语近似的词汇,甚至在音韵上也有好些类似之处,因而主张日语应归属藏缅语族1。但是持反对意见的人认为,日本与藏缅语民族地区之间路途遥远,中间还隔着操南岛语系和满-通古斯语族的民族地区,故此观点大多未加以重视。除了上述五类观点以外、还有学
25、者认为日语应当属于南岛语系。近来有人提出在阿尔泰语系之下构建新语族(韩日-琉球语族)并且将朝鲜语、琉球语以及日语都归入该语族之内。该观点显然是第一类与第二类的混合观点、但是持该观点的人依然需要面对“同源词问题”。,31,汉语某些方言属于阿尔泰语言,目前,学术界普遍认同吴语和客家语均属于汉语。但是有个别人因为吴语与客家语的个别词汇、个别语法现象与阿尔泰语言碰巧相似而提出吴语、客家语属于阿尔泰语言。但要注意这些观点皆不是学术界所普遍认同的观点。第一种猜想认为汉语吴语方言因为少数词汇和阿尔泰语系某些语言可能存在发生学上的对应关系,便提出吴语属于阿尔泰语系的假想。吴语与阿尔泰语系对应的基本词汇数量已经
26、达到约五六十个语法、基本词汇、语音方面都有类似的关系,例如:苏州话中表达“热”的意义,可以叫“奥造”,而在日语中表达“热”竟然也有相似的读音。在苏州方言中,“临顿路”三个字读作“leng deng lu”(音)这种读法发音符合阿尔泰语系语言中“元音和谐”的特点,而这一特点是阿尔泰语系语言所特有的但是持反对意见的人认为这并不为多数以吴语为母语的人所认同,况且仅从词源考证,属一家之言,理由如下:吴语属于汉藏语系汉语族汉语吴语方言区,目前国际上无任何争议,吴语亦不属于任何未定之系属,根据斯瓦迪士核心词列表,吴语和汉语其他方言的同源率高达90%以上,语法亦大体相似。 即使假设存在这些所谓的“五六十个对
27、应的基本词汇”,也尚不能分清是周朝时代或更早同源,或者是南宋定都南京、杭州时候的官话(客家话),蒙古元朝官话、满人清朝官话的混入。且吴语和汉语官话对应的词汇更多,远超过五六十个,按此道理,那么吴语相比阿尔泰语系更应该接近汉藏语系才对,另外吴语中与侗台语(百越语)相同相似程度要比与阿尔泰语系更多,也没有人说吴语属侗台语系。即使分属不同语系的汉语和日语之间的同源辞汇也有47.5%。由此可见,如果以词汇发音相通作为证据也站不住脚,因为这些吴语和日语相通的词汇本身就是汉语同源词而已。更何况日本语语系归属有争议,因为日语和阿尔泰语系其他语言不存在同源词。第二种猜想认为汉语客家语方言和阿尔泰语系有某种联系
28、,理由是:客家语却与朝鲜语相近,不只是发音相似,且文法结构也相同。所以从语言学来讲,客家语、朝鲜语、日语都可以属于阿尔泰语系。然而,朝鲜语存在大量的汉语借词,这些汉字借词的比例相当大,因此所谓的“发音相似”也只是相互的汉字词发音相似而已。此外,朝鲜语的语系归属和日本语一样存在争议,不能说客家语某些地方与朝鲜语类似就能将其归为阿尔泰语系,而客家语的汉语系属已确定,目前国际上无任何争议,客家语亦不属于任何未定之系属。,32,侗台语系,侗台语系,又称壮侗语系、台-卡岱语系,是语言学家划分的一个语系,有70种语言,主要分布在东南亚和中国南部。这个语系在中国称为称为“侗台语族”(或称“壮侗语族”、“壮台
29、语族”、“台语族” 、“黔台语族”等,见覃国生 1997;梁敏、张均如 1996),被认为是汉藏语系的一部分,但国际上将其视作是一个独立的语系。侗台语系和南岛语系有十分密切的关系,有些研究者建议将这两者联合起来,构成一个“澳泰语系”(Austro-Thai),不过,这个见解在语言学家当中仍然有争议。一般认为,侗台语系的发源地在中国浙江、福建、广西、广东一带。从基本词汇的分歧来看,侗台语系的分化可追溯到距今2500年到3000年。长期以来西方学者一般称壮侗语系为“台-卡岱语系”(Tai-Kadai Languages)。卡岱(Kadai)一词是白保罗所造,其中卡(Ka)是指仡央语(包括仡佬语和布
30、央语),岱(Dai)是指黎语。现在一般认为台语支和黎语的亲属关系超过仡央语和黎语,所以台-卡岱的名称不当。泰国籍华人学者许家平(Weera Ostapirat)使用“Kra-Dai”来取代台-卡岱。这个“Kra”指的正是仡央语。,33,侗台语系概念简史,从19世纪至20世纪上半叶,汉藏语言的系属分类经历了从无到有、范围和层次也逐渐清晰的过程。其时,东西方学者的认识基本上差异不算太大,李方桂算是最有代表性的学者。他在1973年的一篇论文中,将汉藏语分为汉语、侗台语族(Kam-Tai)、苗瑶语族 (Miao-Yao)与藏缅语族 (Tibeto-Burman,引自龚煌城 2003,188)。不久后,
31、美国学者白保罗在另一篇重要的论文里,则提出了另外的见解,认为侗台语和苗瑶语并不属于汉藏语系(见Benedict 1942)。不过,李方桂的看法似乎比较有支配性,也成了往后数十年语言学者对于汉藏语言的主要分类方式。白保罗在20世纪70年代的两本重要著作汉藏语概要(见Benedict 1972)以及澳泰语:语言和文化(见Benedict 1975)出版以后,他的看法却慢慢被主要的语言学家所接受,西方学者也一致地缩小了汉藏语系的范围,而不再将壮侗语和苗瑶语归入汉藏语系的范围中。白保罗是人类学家,他认为壮侗语和苗瑶语不属于汉藏语系的主要根据,是他所提出的 “东南亚文化流”这个观念。该论点的核心是:史前
32、该地区的民族种群在文化上是平等的,因此,文化的流向不可能是单向的。多数中国的学者,面对汉语以及壮侗语、苗瑶语之间的可能连带关系时,都只将焦点放在汉语对于这些语言的影响上面,而忽略了这些语言对汉语本身所造成的影响。白保罗这个所谓“东南亚”(Southeast)的概念,并不是指现代理解的中国之外东南亚各国,而是史前时代长江以南这个广大区域,包括现在的海南、云南、广西、贵州、广东、福建、湖南、江西和浙江,以及台湾、中南半岛等地。这些地方当时居住着数目繁多的民族群体,大部分是非“华夏族”(当时的中原居民)。他们从很久远的时期起,就和不同的民族有着文化和语言上的相互接触。这些群体包括了使用孟-高棉语族的
33、族群、使用南岛语的族群、以及使用汉藏语(藏缅语)的族群。正是在这样的基础上,往后的语言学家确立了“侗台语系”这个概念,比较有代表性的学术著作,有Edmondson(1990-1991)、以及 Edmondson and Solnit(1997)。,34,35,乌拉尔语系,乌拉尔语系,包括20多种语言,讲该语系语言的人从东北欧到西北亚2000多万人口。最大的语族为芬兰-乌戈尔语族;最大语言有匈牙利语、芬兰语和爱沙尼亚语。有的语言学家把乌拉尔语系和阿尔泰语系划分为一组语群即乌拉尔-阿尔泰语系。,36,中国的语言,2008年,商务印书馆出版中国的语言,由中国社会学学院民族学与人类学研究所孙宏开、 胡
34、增益、黄行主编,国内少数民族语言学界90多位专家共同编写的。书中收入了中国境内现有的五大语系129种语言,其中汉藏语 系76种、阿尔泰语系21种、南岛语系16种、南亚语系9种、印欧语系1种、混合语系5种,此外还有1种朝鲜语,尚难界定合适的语系。129种语言中,有117种语言是已经濒危或正 在走向濒危的。其中已经濒危的21种,迈入濒危的64种,临近濒危的24种,没有交际功能的8种。在这些语言中,有的使用人数已不足千人,有的更少。比如 木佬语,仅有两位80多岁的老人会讲;而满语、赫哲语、苏龙语、仙岛语等使用人数都不足百人,这些都属于“濒危语言”。,37,汉语方言,汉语方言即存在于各个汉语使用地区的
35、巨大的口语差异,这些方言和现代标准汉语之间有时存在着明显的不同。在地理上,汉语方言的分歧很明显。在说官话的地区,即使相隔几百公里,一般也可以相互理解;然而在其他一些地区,相隔十几公里的当地居民也许已经不能互相理解;甚至有在同一个城市,城南城北居民的语言不能互通的情况。但在同时,多数汉语方言却没有成熟的书面体系,故不同地方的人在书面上采用具有文字上的高度统一性的文言和近代白话体系,使用的民族主要是汉族。中国历史上并非没有语言、方言之争。中国部份学者几千年来一直将吴语、闽语、粤语等称作汉语的方言,而另一部份学者则把它们定性为语言。有人引用西汉扬雄所著的輶轩使者绝代语释别国方言一书以声称粤语为方言,
36、但由于西汉时“言”只能表示“口语”,而非现代语言学意义上的“语言”,因此不足为信。近代以后,西方语言学传入中国。而在西方语言学里,互相之间不能通话的应该被定性为不同是语言(languages)而非不同方言 (dialects)。由于不同汉语言说话者(至少在口语上)通常不能互相通话,于是引起关于吴语、闽语、粤语等是方言还是语言的争论。一些学者为了表明汉语的特殊情况,创造了regionalect或topolect等词,来对译不同汉语言(或曰“汉语的方言”)。另外,值得注意的是,日语的某些方言,如津轻方言和秋田方言等,与标准语差异同样很大,一般人很难听懂,但日语学界也称之为“方言”(详见金田一春彦著
37、日语的特点)。汉语各方言组合成汉语族。重文字分析的语言学家以各方言书同文为由倾向于认为,汉语语族只有汉语一种语言,再分成各种方言;重语音分析的语言学家认为,汉语语族包含闽语、粤语、客语、吴语、赣语、官话、湘语、晋语等八种语言,因为它们之间同源词的发音差异不小于同属日耳曼语族的英语和德语之间同源词的发音差异。中国的语言学家和多数汉学家例如罗杰瑞等都支持前者,而在中国以外的地区,有不少学者支持后者。支持后一个观点的人认为汉语并非一种单一的语言,而是一组互相关联的相近语言。,38,39,官话,官话的名字:有官话和北方话两种,对于认为官话属于方言而非独立语言的人,可附加方言两字,即官话方言、北方方言。
38、其中:历史上在汉语方言学界,“北方话”这种说法的使用频率比“北方方言”低得多,而在非汉语方言学界,如通用的大学汉语教科书、现代汉语词典则有所采用。另“北方话”一词(不含“北方方言”一词)亦可指北方部分地区的官话,具体是北方哪些地区,各家定义不同。 从1980年代后期起,中国大陆的汉语方言学界的期刊和专著已统一使用“官话”这一称呼,“北方方言”“北方话”这些词汇事实上已退出学术领域。“官话”最早是对官方标准话的称呼,汉语官方标准语早期称为雅言、雅音、通语、正音,明清称为官话,1909年开始称为国语,1956年改称普通话;而官话一词演变为“官话方言”的含义。官话方言的名字由官方标准话演变而来,由于
39、北方汉族人口主要使用官话方言,而非官话方言汉族人口主要分布在南方或者说东南一带等原因,过去有人称整个官话方言为北方方言,实际上,西南官话、江淮官话两大官话方言人口都分布在南方。作为中国标准语的官话,东晋、南北朝以来分为南北两支,而最早以晋代中原雅音为基础的南京官话曾经长期是中国的官方语言。五胡乱华、衣冠南渡以后,中原雅音南移,作为中国官方语言的官话逐渐分为南北两支。明灭元朝,定都南京,“壹以中原雅音为正”,即以南京音为基础音系,南京官话为国家标准语音。北方官话直到清代中叶以后才逐渐取代江淮方言系的南方官话成为中国官方的标准语。明清时期来华的西方传教士所流行的中国话,基本上是以南京官话为标准,直
40、到民国初年西方传教士主持的“华语正音会”,也以南京音为标准。清末编审国语及民国确定新国音以后,北京官话成为中国官方的标准语。东北北京官话今天是现代标准汉语的基础(中国大陆称为普通话,台湾称为国语,新加坡和马来西亚则称为华语)。以官话方言为母语的人约占汉语总人口的70%。官话的明显特点包括:失落了大部分的中古辅音韵尾。中古汉语中的“-p,-t,-k,-m,-n,-ng”现在已经只剩下“-n,-ng”两个。大 多数官话方言没有入声。同时,与其他方言相比,官话的声调较少。(这是因为大部分的官话方言只有 平声区分阴阳。)因此,官话包含了大量的同音字以及相应产生的复合词。这在其它方言中比较少见。,40,
41、41,吴语,吴语,又称吴方言、江南话、江浙话,是一种属汉藏语系汉语族的声调语言。主要通行于中国江苏南部、安徽南部、上海、浙江大部分地区、江西东北部和福建西北角及香港、台湾、日本九州岛、美国旧金山等地说吴语的移民中间。使用人数约为汉语总人口的 8.4%。吴语语音和现代官话差别大。词汇和语法独特,用吴语对话夹杂官话叙述写成的小说海上花列传非吴语人无法深入理解其内涵。在语言学分类上,中国北方学者与一些江浙及西方学者间存在分歧。前者出于文化和政治上的考虑,将吴语作为单一语言汉语的一种方言;而反对者认为吴语的分类因成为汉藏语系吴语语族,是一门独立的语言。两者各有其语言学的依据。,42,客家话,客家话,或
42、称客家方言、客方言、客语,在中国南方的客家人中广泛使用,主要包括广东东部、北部、福建西部、江西南部及西北部、广西东南部、台湾、四川等地,以梅县话为代表。作为现时 的一种南方方言,客家话是在唐宋北方移民南下的影响中形成的,客家话因而保留了较多中古中原语言的特点。各地客家话中的入声韵,还不同程度地保留着中古汉 语中存在的塞音及鼻音韵尾。客家话不仅限于汉族使用,在福建和浙江的畲族中也广泛使用。客家话也是海外华人社区使用较多的汉语方言之一。使用客家话的人口 大约占汉语总人口的5%。,43,闽语,闽语,中国大陆称闽方言,为汉藏语系汉语族内的一种语言,其保存了许多上古汉语的特色,同时也有不少古闽越语的遗留
43、。闽语源自古吴语,系最早从古汉语中分离出来的一种语言,因此内部分化最显著。主要分布于福建、台湾两地大部分地区,以及广东、海南、浙江的些许地区。1955年在语言学分类上将闽语作为一个语支,下分闽南、闽北两语,1963年则合而为一,下分闽南、闽东、闽北、闽中、莆仙五种方言。传统的“汉语七大方言”理论中,闽语被看作是“七大方言”中语言现象最复杂,内部分歧最大的一个方言。闽语北起浙南,沿海南下经福建省、广东省至广西壮族自治区,又跨海至海南、台湾,复因移民关系,东南亚地区华人也多操闽语,尤以闽南语(含潮汕话)为大多数。东南亚华人所称福建话都是指闽南语当中的泉漳片,而台湾话的意思亦是相当于福建话,同属闽台
44、片。使用闽南语的人口大约为汉语人口总数的4.5%。,44,闽语,台湾台湾使用闽语方言族群主要使用闽南语,迄今仍为台湾第一大母语、及使用量第二的语言。根据2009年中华民国年鉴,台湾大概有73%的人会使用闽南语。由于地域与大陆区隔且曾为日本殖民地,因此部分语言已融入日语与现代标准汉语用法(如:台湾称煤气为瓦斯从日文发音而来,而闽南语也音近日语。东南亚 文莱:华人人口45,800人,大部分为福建人。首都斯里布加湾通行同安县金门音的闽南语。 缅甸:华人大约900,000人,福建人占约40,海南人3。通行漳州音闽南语。 印尼:华人人口600万人,福建人逾半,海南人与潮州人略少。通行漳州音闽南语,语音接
45、近我国的北马闽南话。 老挝(老挝):华人大约5000余人,接近90为潮州人。通行潮州音闽南语。 马来西亚:华人接近600万人,福建人有200万人,潮州与海南人之人口,在各方言群中排列第4及5位。北马盛行漳州音及潮州音闽南语,中、南马通行泉州、永春及潮州音闽南语,海南音闽南语盛行于南马及东海岸部分地区,东马通行漳州音闽南语。 菲律宾:华人人口约有百万人,90为福建人,大部分祖籍泉州晋江。通行泉州音闽南语。 新加坡:华人人口200余万人,福建人约90万,潮州人有47万,海南人有15万,操闽南语系者,占了华人总人口的71。盛行泉州及潮州音闽南语。 泰国:华人人口接近600万人,潮州人逾40,海南人1
46、8,福建人16。通行潮州音闽南语。唯普吉岛及泰南部分地区通行漳州音闽南语。 越南:华人人口近百万人,潮州人占34,福建人6,海南人2,共计42。通行潮州音闽南语。东南亚十国加上当地会讲闽南语的华人,以及欧洲、澳洲、美洲等国家,全世界会讲闽南语的人,接近8000万人。,45,粤语,粤语,或称白话,以广州话(广府话)最有影响力,并作为标准粤语,主要分布广东省中西部、广西南部、香港、澳门等地以及东南亚、北美的主要华人社区。相比普通话的4声,粤语共9声,当中6个为平、上、去声,余下3声以-p、-t、-k三个短促音结尾的发音,称为入声。它是保留中古汉语特征较多的方言之一,包含-p、-t、-k、-m、-n
47、、-ng六种辅音韵尾,与隋唐时期的中古汉语韵书相对照,其音韵系统最符合。广州话和香港话只有微小差异,主要是香港人的懒音与香港推行的粤语正音运动所致,还有因应两地分治而出现词汇差异,但使用两地方言的人一般可以无障碍沟通。粤语一个主要的分支是五邑地区(新会、台山、开平、恩平、鹤山)使用的方言,只会广州话的人一般只能听懂一半的五邑话。另外,粤语内部与其他粤语次级方言差异最大的是广西东南部的“勾漏粤语”,有十个声调,有 b、d两个浊音声母,与其他粤语区的方言通话比较困难。目前全球粤语使用人口大约有1亿人,使用地区非常广泛。粤语不仅在海外华人社区中被广泛应用,而且支持着香港文化及南粤文化为中心的粤语文化
48、,这使得粤语具有很强的影响力。,46,湘语,湘语,又称湘方言或湖南话,属汉藏语系汉语,主要分布在中国大陆湖南省相当部分地区、临近湖南的重庆市和广西部分地区;以长沙话和双峰话为代表。湘语分为新湘语和老湘语。湘语使用者约占汉语总人口的5%。湘语的语音特点为:古浊声母今读不送气清 音,没有平翘舌或前后鼻音的区别,及n-/l-不分、hu-/f-不分、ch-/q-不分、ong/eng不分等。长沙话、湘潭话、岳阳话、益阳话等均属于新湘语。老湘语包括衡阳话,湘乡话,邵阳话等,其中湘乡话分布在湘乡、双峰、娄底、涟源四县市,发音基本一致。新湘语主要流行于长沙市和湘北,受官话和赣语的影响比较大。老湘语分布在衡阳市
49、、湘乡(含双峰县)一带,受外部方言影响较小。新老湘语之间互通程度较低。总体来看,官话方言中的西南官话由于在形成过程中受到了湘方言的极大影响,而新湘语在形成过程中也受到了官话较大的影响,所以西南官话与新湘语有一定相似性。有人也主张把新湘语划入官话。但相当多的人持反对意见,认为新湘语与西南官话有许多明显的区别,比如前者较完整地保留了入声调(后者分布的大部分区域都无入声),前者古浊音字今虽清音化,但仍是不送气音。两者有一定的互通程度只是说明西南方言是“南方化”的官话。事实上,说新湘语的人往往较容易听懂西南官话,而说西南官话的人听懂新湘语还存在着相当明显的困难。但是由于湖南东南部多山所以在群山包围着一些县城,当地的方言基本保持在一种初融和状态,而且这些散居在山区的人是来自中原地区,因为数次的南迁带来了北方方言的部分特点,在这得以保留。,