1、中文字的特性,(一)中文字的屬性 中文字兼具形、音和義三者,不同於表音字母(alphabets)的只具形和音(例如:英文字母、日語假名、阿拉伯文字等),因而被稱為表意文字(ideographs) 。,就目前的中文資訊處理能力而言,處理中文字的形和音的方法與技術已經達實用的程度,但是對於表達和處理字義的研究,則有待突破。,中文字的屬性(attributes)意指用以描述中文字的形和音的一些訊息,這些訊息主要運用於中文字的輸入、輸出和排序等場合。中文字的字形屬性,包括: 1.與中文字輸入相關者:依據某些種輸入法(例如:倉頡輸入法)所逐字賦予的形碼、某些中文碼(例如:Big5碼),甚或不常用的四角碼
2、、三角碼等。 2.與中文字輸出相關者:某幾種字型(font,例如:楷書、宋體、黑體、隸書等)的點陣,以及依某些種向量組字規範(例如:True type、Postscript等)所逐字賦予的字型表示式。 3.與中文字分類、排序相關者:部首、筆劃數(不含部首)、總筆劃數(含部首)、組字部件、筆順等。,中文字的字音屬性,國語發音由21個聲母(例如:、等)和39個韻母(例如:、等)所組成,若不考慮聲調變化,共有411個基本發音。加上五聲(第一至第四聲和輕聲)變化,則可演化成2,055個不同的發音。,中文字的特性,中文字數量龐大,但常用字僅佔少數 ,學會3,000個最常用的中文字就能認得近代中文報章、書
3、籍用字的99%。,時代 西元份 書 名 作 者 所收字 遞增字 秦 倉頡篇 斯 3,300 漢 15 訓纂篇 揚雄 5,340 2,040 漢 6070 續訓纂篇 班固 6,120 780 漢 100 文解字 許慎 9,353 3,233 魏 227239 聲 登 11,520 2,167 晉 字 忱 12,824 1,304 後魏 字統 楊承慶 13,734 910 後魏 480 廣雅 張揖 18,150 4,416 543 玉篇 顧野王 22,726 4,576 唐 751 唐韻 孫愐 26,194 3,468 唐 753 韻海鑑源 顏真卿 26,911 717 宋 10371067 集韻
4、 丁 29,992 3,081 宋 1066 篇 王洙等 31,319 3,319 明 1615 字彙 梅膺祚 33,179 1,860 清1675 正字通 張自 33,440 261 清 1716 康熙字典 張玉書等 42,174 8,734 現代 1915 中華大字典 中華書局 44,908 2,734 現代 1969 中文大辭典 張其昀等 49,888 4,980 現代 1990 漢語大字典 徐中舒等 54,678 4,790 現代 2004 體字字典第五版106,230 51,552 教育部國語推委員會,教育部國語推行委員會八十四年常用語詞調查報告書就總計1,982,882字次的語料加
5、以分析,共找出5,731個相異的中文字。根據該報告所附的字頻總表,出現頻率最高的中文字的其出現頻率為1.65%,二十五史的中文字出現總和為31,409,450字次,共使用了13,966個中文字,較常用的中文字,總數不超過4,000。 除此之外的大多數中文字出現在個別檔當中,其頻率平均還不到兩次(事實上,大多數僅出現一次)。可見中文字的使用頻率主要是受到個人識字、用字能力的限制,而與時空環境變遷的關係不大。 現代中文電腦大陸的系統規定只有個標 準簡體字、而台灣系統的則有個正體 字。,所有辭彙皆可由單字、單詞輕易組合而成新義 如大學、大家、電話、電視、電腦等等。故識字不多,即足應付日常之需。東漢許
6、慎說文解字成書於西元100年,收字9353字,而成書於康熙55年西元1716年之康熙字典,收字亦僅42174字。1616年間中國文字僅增32821字而已,而其中常用字充其量不過4000,已足敷日常之需。以下諸書字數統計可以見出中國文字學、用之便易: 十三經6544字 五經4754字 杜甫詩4390字 王維詩2473字 四書2328字 三民主義2134字 憲法 682字,中文單字的使用頻率會因時、因地,以及因應用領域而異,例一,璿、堃兩字原本不是常用的中文字,但是在孫運璿、遊錫堃兩位先生分別擔任行政院長期間,由於他們的姓名幾乎是天天見報,因而使得璿、堃字的使用頻率明顯激增,幾乎變成新聞業者的常用
7、字。,例二,冇(發音近似,意為沒有)為粵語方言字,在香港地區可算是常用字,但在非粵語地區則極少使用。,例三,在一般白話檔裡,使用頻率最高的中文字為的,但是在電信、電力、自來水等用戶資料庫裡,的字卻甚為罕見,取而代之的最常用字為每個用戶地址裡都有的號字。,中文會因時、因地、因事而造新字,例如:中文字隨著時間而增加字數,台灣早期移民常以發音近似的中文字加上口邊以音譯原住民地名、武則天為命己名而造新字曌、有些化學元素名稱 、魚類名稱、生物化學用字為近代所創等。,字形特性中文字多異體字,若兩個中文字同音、同義,卻不同字形,則稱這兩個中文字互為異體字。一般說來,常用的中文字較易於產生異體字。例如,常用的
8、台和臺兩字即互為異體字;由於中文一字多義,使得一些中文字在某些中文詞裡可以互換(可視為異體字),但在別的中文詞裡卻又不能互換使用。例如,五元可以寫成伍圓,但行伍卻不同於行五,元首不能寫成圓首。這種現象對中文資訊檢索造成相當大的困擾。,字形特性,(一)字體方正如圖,易於辨識 日本人嘗於高速公路並豎中、日、英文路標,令駕車者以定距、定速前進,測其辨識三種文字之速度,發現中文辨識最快,日文次之,英文為殿。因中文為方塊、獨立的圖案,讀字猶如視圖,且僅讀其部份,即可猜知全文,而英文則須通讀每一字母,始能瞭解全文也。,字形特性,(二)字字獨立,排列方便,可作任一走 向書寫與閱讀 如商家玻璃門、窗廣告文字,
9、兩面讀之,皆可辨識,其他拼音文字如英文則不能。又,中國文字無論遮其上、下、左、右,僅露其半,仍多可識,拼音文字則萬萬不能。(例:可以清心也、本日大賣出),字形特性,(三)形聲造字,體便分合 中國文字十之七八為形聲字,字分二部,乃至三四部組合造字,體便分合,因此造字簡易,且利辨識(切瓜分片橫七刀豎八刀、雲破月來花弄影能 、 張長弓騎奇馬 )。,聲音特性,(一)單一音節,發音容易,而有節奏感 每字最多由聲母、介音、韻母三部份組成,而僅具單一音節,如:平字;少則僅有韻母而已,如:安字。因此發音容易,而有節奏感。例外:琵琶.葡萄.玻璃.蝴蝶.蜻蜓.螳螂.逍遙.徘徊.徬徨.躊躇.踟躕.婆娑.玲瓏.窈窕-
10、連綿詞(不可拆開的詞),聲音特性,音義相關 同音,或同一聲母,或同一韻母之字,其義類似,且其字義與發音口 形亦有密切關係:如:宏、洪、鴻、泓、閎皆有大義,而此時口 形恰亦最大。又如:纖、線、細、絲皆有細義,其音乃齒間音,氣息通過齒間出出聲時,恰成一細線。又如:彎、灣、宛、轉、團、圞、 管、環、丸皆有圓義,蓋其發音口形恰成圓形也。,聲音特性,一字多音(破音字)一字多音,音異則義異 破音字的產生,一方面因為古人的假借,一方面因為時間的變動以及地方的不同,造成讀音的差異。 例:以女女女,女將如何待之? 發音是,意思是說我把我女兒嫁給你,你將會如何對待他,聲音特性,多字一音(同音字) 二字一音可形成一
11、語雙關(諧音)之趣味;然如多字一音,則易致語意不明,是其缺點。,聲音特性,施氏食獅史(趙元任): 石室詩史施氏,嗜獅,誓食十獅。氏時時適市視獅。十時,適十獅適市。是時,適施氏適市。氏視是十獅,恃矢勢,使是十獅逝世。氏拾是十獅適氏石室。石室濕,氏拭室。氏始試食十獅屍。食時,始識是十獅屍實十石獅。試釋是事。,聲音特性,伊姨殪,遺億鎰。伊詣邑,意醫姨疫,一醫醫伊姨。翌,億鎰遺,疑醫,以議醫。醫以伊疑,縊,以移伊疑。伊倚椅以憶,憶以億鎰遺,以議伊醫,亦縊。噫!亦異矣 (遺鎰疑醫趙元任) 于瑜欲漁,遇余于寓。語余:“余欲漁于渝淤,與余漁渝歟?”余語于瑜:“余欲鬻玉,俞禹欲玉,余欲遇俞于俞寓。”余與于瑜遇
12、俞禹于俞寓,逾俞隅,欲鬻玉于俞,遇雨,雨逾俞宇。余語于瑜:“余欲漁于渝淤,遇雨俞寓,雨逾俞宇,欲漁歟?鬻玉歟?”于瑜與余禦雨于俞寓,俞鬻玉于余禹,雨愈,余與于瑜踽踽逾俞宇,漁于渝淤(楊富森于瑜與余欲漁遇雨)。,聲音特性,李清照聲聲慢 尋尋,覓覓,冷冷,清清,悽悽,慘慘,戚戚。乍暖還寒時候,最難將息。三杯兩盞淡酒,怎敵他晚來風急。雁過也,正傷心,卻是舊時相識。滿地黃花堆積,憔悴損,如今有誰堪摘?守著窗兒,獨自怎生得黑?梧桐更兼細雨,到黃昏點點滴滴。這次第,怎一個愁字了得!,擬聲聯 獨覽梅花掃臘雪 依睨山勢舞流溪 Do Re Mi Fa So La Si 1 2 3 4 5 6 7,字義特性,漢字
13、是世界獨有的概念文字,其中蘊涵的微言大義,是古人思維的結晶,數千年來行文乃至思考的根本,因此古文能夠言簡意賅,含意深遠。但由於白話文運動鼓吹以詞取代字,現在的辭典僅解釋詞義而不談及該詞義的由來;而現代的字典則多以詞為基準,將漢字分成一條一條解釋,違反漢字本質,令漢字看似費解且難以學習。漢字本義被人忘卻,現代人中文水平低落,正因不能辨明字義所致。,字義特性-引申義,從本義引申發展出來的意義,是造成漢字一字多義的重要原因。引申義與本義有一定聯繫,它是人類思維運動即在語言運用中發揮了聯想和類推作用的結果。活本義是水流暢通(活水)。引申之,凡是動的東西都叫活(活塞)。進而有生命的東西都叫活。進而生物的
14、存在方式叫做活 。朝:早晨朝見朝廷朝代,字義特性假借義,通過文字的同音假借使該字表示的意義 假借是把漢字當成一個純粹的表音符號。假借使一個漢字起到了幾個漢字的作用。 1、本無其字的假借一種情況是,假借字一直歸該詞使用:其,本義畚箕,借為代詞、語氣詞。後為本義造箕。耳,本義耳朵,借為語氣詞耳 ,借義和本義並存。,字義特性假借義,2、本有其字的假借(通假)常見的通假例:共供 闕缺 說悅知智 取取 反返直只 有又 景影坐座 縣懸 曷何,文法,1.文法簡單,無人稱、單複數、時態、性質、詞類變化等等複雜文法規則 孤村、落日、殘霞;輕煙、老樹、寒鴉。一點飛鴻影下,青山、綠水、白草、紅葉、黃花。 -白樸天淨沙 。 枯藤、老樹、昏鴉;小橋、流水、人家;古道、西風、瘦馬。夕陽西下,斷腸人在天涯。 -馬致遠天淨沙,文法,2.所有辭彙皆可由單字、單詞輕易組合而成新義 如大學、大家、電話、電視、電腦等等。故識字不多,即足應付日常之需。,