漢字

偷月 · 發表於 2007-3-29 10:57

來源: 中國網

記錄漢語的文字系統，並仍然或曾經在日語和朝鮮語、越南語中使用。漢字是世界上最古老的文字之一，擁有4500年以上的歷史。狹義地說，它是漢族的文字；廣義地言，它是漢字文化圈共同的文字。
漢字是漢語書寫的最基本單元，其使用最晚始於商代，歷經甲骨文、大篆、小篆、隸書、楷書（草書、行書）諸般書體變化。秦始皇統一中國，李斯整理小篆，『書同文』的歷史從此開始。儘管漢語方言發音差異很大，但是書寫系統的統一減少了方言差異造成的交流障礙。
東漢許慎在【說文解字】中將漢字構造規律概括爲『六書』：象形、指事、會意、形聲、轉注、假借。其中，象形、指事、會意、形聲四項爲造字原理，是『造字法』；而轉注、假借則爲用字規律，是『用字法』。
三千餘年來，漢字的書寫方式變化不大，使得後人得以閱讀古文而不生窒礙。但近代西方文明進入東亞之後，整個漢字文化圈的各個國家紛紛掀起了學習西方的思潮，其中，放棄使用漢字是這場運動的一個重要方面。這些運動的立論以爲：跟西方拼音文字相比，漢字是繁瑣笨拙的。許多使用漢字國家即進行了不同程度的漢字簡化，甚至還有完全拼音化的嘗試。日文假名的拉丁轉寫方案以及漢語多種拼音方案的出現都是基於這種思想。中國大陸將漢字筆劃參考行書草書加以省簡，於1956年1月28日審訂通過【簡化字總表】，在中國及新加坡使用至今。台灣則一直使用繁體中文。
漢字是承載文化的重要工具，目前留有大量用漢字書寫的典籍。不同的方言都使用漢字作爲共同書寫體系，因而漢字在歷史上對中華文明的傳播起到了重要作用，並成爲東南亞文化圈形成的內在紐帶。在漢字發展過程中，留下了大量詩詞、對聯等文化，並形成了獨特的漢字書法藝術。
一個漢字一般具有多種含義，也具有很強的組詞能力，且很多漢字可獨立成詞。這導致了漢字極高的『使用效率』，2000左右常用字即可覆蓋98%以上的書面表達方式。加之漢字表意文字的特性，漢字的閱讀效率很高。漢字具備比字母文字更高的信息密度，因此，平均起來，同樣內容的中文表達比其他任何字母語言的文字都短。
目前在使用漢語的地區，大都使用兩種規範漢字，分別是繁體中文（繁體字）和簡體中文（簡體字）。前者用於台灣、香港、澳門和北美的華人圈中，後者用於中國大陸和新加坡以及東南亞的華人社區。通常說來，兩種漢字書寫系統雖然有差異，常用漢字的個體差異不到25％。
由於漢字書寫複雜，『漢字落後論』的說法存在了很長時間，認爲漢字是教育及信息化瓶頸，並有『漢字拉丁化』甚至廢除漢字的推動行爲。現在一般認爲漢字也有突出優點，初始學習難度雖大，但掌握常用字後不存在類似海量英文單詞的繼續學習問題，且其表意特性也能充分調動人腦的學習能力。在計算機輸入問題基本解決後，『漢字落後論』及『漢字拉丁化』已實際上逐漸被大多數人拋棄。
目前漢字系統已經基本穩定，但漢字的規範化、生僻字的自然消亡仍在繼續進行。
造字原理
六書是漢字組字的基本原理，在周禮中就有提到了六書，只是沒有說明具體內容。到了東漢，許慎在【說文解字】中，詳細闡述了『六書』這個漢字構造原理：象形、指事、會意、形聲、轉注、假借。
象形：這種造字法是依照物體的外貌特徵來描繪出來，所謂畫成其物，隨體詰詘是也。如日、月、山、水等四個字，最早就是描繪日、月、山、水之圖案，後來逐漸演化變成現在的造型。
指事：這是指表現抽象事情的方法，所謂『各指其事以爲之』是也。如卜在其上寫作『上』，人在其下寫作『下』。
形聲：此乃文字內以特定形狀（字根）表特有的音。例如：胡，這個字也可爲一個字根，結合不同的屬性字根，可合成爲：蝴、蝴、湖、葫、瑚、醐等等，而以同樣的發音(也有的只有聲母一樣)，表達不同的事物。但形聲字，也因古今語言音韻變遷，不少古代同類形聲字在今天的官話已無共同音素了。
會意：這個造字法，是將兩個字根組合起來，使衍生出新的含意。如『日』和『月』組起來，就是日光加月光變成『明』。『人』字和『言』字合成『信』字，意思就是人過去所言；有信，就是這個人都很遵守自己說過的話。
轉註：這是用於兩個字互爲注釋，彼此同義而不同形，漢代許慎解釋道：『建類一首，同意相受，考、老是也。』，這怎麼說呢？此二字，古時『考』可作『長壽』講，『老』、『考』相通，意義一致，即所謂老者考也，考者老也。詩經的【大雅•朴】亦云：『周王壽考。』。蘇軾的【屈原塔詩】也有古人誰不死，何必較考折。一語。其中的『『考』皆『老』意，特別注意的是，後代的文字學家針對許慎的前述的定義也作了大量的解釋。其中包括『形轉說、聲轉說、義轉說』三類，只是這三種說法有人認爲不夠全面，當代古文字家林V先生也有解釋說『轉注』就是一個形體（字根）記錄兩個讀音和意義完全不同的兩個詞。例如『帚和婦』與甲骨文中的『母和女』等等。
假借：這法簡言之，借用一字，去表達別的事物。一般來說，是有一個無法描述的新事物，就借用一個發音接近或是屬性近似的字根，來表達這個新事物。例如：『又』，本來是指右手（最早可見於甲骨文），但後來被假借當作『也是』的意思。聞，本意是用耳朵聽東西的意思。例如【大學‧第七章】中有『視而不見，聽而不聞，食而不知其味』，但後來被假借成嗅覺的動詞(不過也有人認爲這是錯用)。
總結以上六書，前兩項，『造字法』也；中兩項，『組字法』也；後兩項，『用字法』也。這六個原理，是古代文字學學者歸納出來的字學理論。其所含漢字構成法則，是長期演化而成的，不是任何一個人獨創的。
漢字的結構
漢字由一個或以上的字根以二維方式（歐語系是一維文字）在特定的空間、配置在一個正方塊內而組成，因此有方塊字的別稱，從結構上來看，漢字有以下特色：
單一字內就有很高的信息密度，在表達同樣的事物時，可比表音文字用更短的篇幅表達同樣的訊息，所以漢字的閱讀效率很高。
一個漢字乃由四百多個表意象形字母爲基本字根，如金、木、水、火、土等，像積木一樣組合而成。
一個未知文字的含意，可拆字，從組成字根以及空間的配置推斷出其字義。當時代演進出現新事物難以詞的方式來表達時，也能以字根組合原則，合成出新字來用，例如中文的鈾字，就是近代爲了表現一種新發現的化學元素而新造的字。
漢字組成的字根空間配置對字義有影響：如同樣是『心跟亡』的合體，左右排是『忙』，上下排是『忘』，排列不同，導致不同含義；文字右邊有『V』這個字的部件，這表示右手（手的左偏旁表示左手）持某物對左邊字根作某事（金文、甲骨文考古的發現），如果右手上面拿東西就變成『攵』，有這個字根的，幾乎都是攻擊性或是用暴力達成某件事，例如攻、敗、敲、收、散、政、牧、敕等等。
字形（漢字書法）
『國』這個字的筆畫漢字有各種不同的書寫方式，即有不同的字體；不同的字體，漢字的字形不一樣。
規整的字體（如楷書、宋體、隸書、篆書等）書寫下的漢字是一種方塊字，每個字占據同樣的空間。漢字包括獨體字和合體字，獨體字不能分割，如『文』、『中』等；合體字由基礎部件組合構成，占了漢字的90%以上。合體字的常見組合方式有：上下結構，如『笑』、『尖』；左右結構，如『詞』、『科』；半包圍結構，如『同』、『趨』；全包圍結構，如『團』、『回』；複合結構，如『贏』、『斑』等。漢字的基礎部件包括獨體字、偏旁部首和其他不成字部件。
漢字的最小構成單位是筆畫。
書寫漢字時，筆畫的走向和出現的先後次序，即『筆順』，是比較固定的。基本規則是，先橫後豎，先撇後捺，從上到下，從左到右，先外後內，先外後內再封口，先中間後兩邊。不同書寫體漢字的筆順可能有所差異。
讀音
漢字是多種方言的共同書寫體系，每個字代表一個音節。中國大陸現今以普通話作爲標準讀音，普通話的音節由一個聲母、一個韻母及聲調確定，實際用到1300多個音節。由於漢字數目龐大，因而有明顯的同音字現象；同時還有同一字多音的情形，稱爲多音字。這一情況在各種漢語中是普遍存在的。
漢字雖然以表意爲主，但並非沒有表音成分，最常見的是人名、地名，其次就是外來詞的音譯，比如沙發。此外，還有部分原有的表音詞，如（一命）『嗚呼』、『哈哈』大笑等。但即使如此，還是有一定表意成分，特別是該國國內的人名、地名。而即使是國外的人名、地名，也存在某些表意的底線，比如『Bush』絕不能音譯成『不死』。
由於漢字本身不表音，自漢朝到20世紀漢字在數量上、寫法上雖有變遷，但無法看出發音的變化。必須進行專門的研究才能推測它們在上古漢語和中古漢語的發音。有學者經研究認爲：漢朝之前，一個漢字發音爲兩個音節，次要音節和主要音節，類似今日的韓、日語。詳見上古漢語。
漢字在日語中的讀音有『音讀』和『訓讀』之分，往往一個字有很多讀法，原因來自中國不同時期傳入日本的發音。
在朝鮮語中則大致爲一字一音，沒有訓讀。
除了日本以外，其他漢字使用國也有使用了一些多音節的字，如『傘保ê＠錚、『懟保加侖）、『』（千瓦）等。但是在大陸地區由於官方廢除已基本不使用，台灣仍在使用，一般人也明了其意思。
注音
最早的注音方法是讀若法和直注法。讀若法就是用音近的字來注音，許慎的說文解字就採用這種注音方法，如『停射臬也，讀若准』。直注法就是用另一個漢字來表明這個漢字的讀音，如『女爲說己者容』中，使用『說者曰悅』來進行注音。
以上兩種方法都有先天上不完善的地方，有些字沒有同音字或是同音字過於冷僻，這就難以起到注音的作用，例如『襪音c』等。
魏晉時期發展出了反切法，據傳是受使用拼音文字的梵文影響。漢字的發音可以通過反切法進行標註，即用第一個字的聲母和第二個字的韻母和聲調合拼來注音，使得所有漢字發音都有可能組合出來。如『練，朗甸切』，即『練』的發音是『朗』的聲母與『甸』的韻母及聲調所拼成。
近代以來，又發展出了漢字形式的注音符號（俗稱ㄅㄆㄇㄈ）以及很多拉丁字母注音方法。注音符號仍是台灣教學的一部分，而目前中國大陸最爲廣泛使用的是漢語拼音。
由於漢字以本身表義爲主，注音方面較爲薄弱。這個特性使得上下千年的文獻，不至於產生如同使用拼音文字的西方世界一樣，用字措辭太懸殊的差距，但也造成推斷古代聲韻的難度。例如『龐』從『龍』而得聲，但今日北京話前者讀『páng』，後者爲『lóng』。如何解釋這樣的差異，就是音韻學所探討的課題。
漢字與詞語
漢字是漢文組成的最小單位。
語素是漢文表意的最小單位，類比於英語的『詞彙』和『詞組』的總稱。絕大多數漢字可以獨立構成語素，比如『我』，類比於英語中的單一字母構成的詞彙，比如『I』。現經白話文大多數詞語都是由兩個以上的漢字構成的，不過，和英語中『詞彙』和『字母』的關係不同，語素的意思往往和其中各個漢字獨立構成語素時的意思有相關性，因此相當程度上簡化了記憶。
詞語包括語素和若干個語素形成的短語。
漢字的高效率，體現在幾百個基本象形字，可以合成表示天上地下的各種事物的上萬漢字；幾千個常用字，又可以輕鬆組合出數十萬詞語。
不過，從另一方面來說，準確掌握這數十萬詞語的搭配形式和用法也成了一種負擔。漢語常用詞彙約爲幾萬條，總詞彙量約有百萬條，雖然從數量上來說顯得有些令人望而卻步，但由於大多數漢字構詞法的表意性，要基本掌握並非遙不可及。因此，僅就詞彙而言，其學習難度並不高；相比之下，掌握同樣數量外文詞彙的記憶強度則要大得多。
而從古文的角度來看，用字本義，比起五四白話文運動以降過度依賴詞語，會來的精確且有效率，例如朱邦復先生就提暢精確使用漢字的復古作爲。
漢字的數量
漢字的數量並沒有準確數字，日常所使用的漢字約爲幾千字。據統計，1000個常用字能覆蓋約92%的書面資料，2000字可覆蓋98%以上，3000字時已到99%，簡體與繁體的統計結果相差不大。
歷史上出現過的漢字總數有8萬多（也有6萬多的說法），其中多數爲異體字和罕用字。絕大多數異體字和罕用字已自然消亡或被規範掉，除古文之外一般只在人名、地名中偶爾出現。此外，繼第一批簡化字後，還有一批『二簡字』，已被廢除，但仍有少數字在社會上流行。
漢字數量的首次統計是漢朝許慎在【說文解字】中進行的，共收錄9353字。其後，南朝時顧野王所撰的【玉篇】據記載共收16917字，在此基礎上修訂的【大廣益會玉篇】則據說有22726字。此後收字較多的是宋朝官修的【類篇】，收字31319個；另一部宋朝官修的【集韻】中收字53525個，曾經是收字最多的一部書。
另外有些字典收字也較多，如清朝的【康熙字典】收字47035個；日本的【大漢和字典】收字48902個，另有附錄1062個；台灣的【中文大字典】收字49905個；【漢語大字典】收字54678個。20世紀已出版的字數最多的是【中華字海】，收字85000個。
在漢字計算機編碼標準中，目前最大的漢字編碼是台灣的國家標準CNS11643，目前（4.0）共收錄可考證之繁簡、日、韓語漢字共76,067個，但並不普及，只有在戶政系統等少數環境使用。台港民間通用的大五碼收錄繁體漢字13053個。GB18030是中華人民共和國現時最新的內碼字集，GBK收錄簡體、繁體及日語、韓語漢字20912個，而早期的GB2312收錄簡體漢字6763個。而Unicode的中日韓統一表意文字基本字集則收錄漢字20902個，另有兩個擴展區，總數亦高達七萬多字。
初期的漢字系統字數不足，很多事物以通假字表示，使文字的表述存在較大歧義。爲完善表述的明確性，漢字經歷了逐步複雜、字數大量增加的階段。漢字數量的過度增加又引發了漢字學習的困難，單一漢字能表示的意義有限，於是有許多單一的漢語意義是用漢語詞語表示，例如常見的雙字詞。目前漢語書寫的發展多朝向造新詞而非造新字。
漢字編碼系統：爲進行信息交換，各漢字使用地區都制訂了一系列漢字字符集標準。
國標碼（『國標』是中華人民共和國國家標準的簡稱）在中國大陸使用。GB2312收錄6763個漢字，GBK收錄20912個漢字，最新的GB18030收錄27533個漢字。
BIG5碼。收錄13053個漢字。在台灣和香港使用的一字節或兩字節編碼。
Unicode並不被中國政府很好的接受。中國政府要求在中國大陸出售的軟體必須支持GB18030編碼。
在國際通信化和軟體設計領域，CJK編碼收集了漢語、日語、韓語中的漢字集。
關於Unicode：由於各國國家標準字集所收的漢字字數、常用字的差異，雖然象中國兩岸GB/BIG5字集常用字基本類似，轉換後閱讀並不成問題，但是這種編碼轉換的混亂關係，對文字交流始終是一種障礙。因此相關國家的標準化組織和文字工作者經過共同努力，終於在93年完成了包含中日韓(CJK)漢字的Unicode漢字標準ISO10646.1。Unicode是完全雙字節表示的多國文字編碼體系，編碼空間0x0000-0xFFFF。ISO10646.1漢字標準使用編碼0x4E00-9FA5，共包含20902個漢字。其中：大陸(S)提出的漢字17124個，台灣(T)提出的漢字17258個;S與T的併集，即中國(C)提出的漢字爲20158個。日本(J)提出的漢字爲12157個，中國未提出的690個(Ja);韓國(K)提出的漢字爲7477個，其中中國未提出的90個(Ka);Ja與Ka併集共744字。支持Unicode編碼的相關電腦系統軟體，如Unix,Win95已有推出，但是由於Unicode的ASCII碼是用雙字節編碼(即一般電腦系統中的單字節ASCII碼前加0x00)，同時其漢字編碼與各國的現有編碼也不兼容，造成現有的軟體和數據不能直接使用，所以目前完全使用Unicode軟體系統的用戶並不多，大多數隻將它此作爲一個國際語言編碼標準來使用。

[訓詁學] 漢字

相關帖子

切换语言