Sunday, February 22, 2026

汉字演变中的两次飞跃 - 四百多汉字是怎么组成完美的语言体系

一,独体象形字的产生

最先古人是没有文字的。怎么会要造字呢?因为需要记下发生的事情,比如,昨天抓到两条鱼,那就画两条鱼

鱼-甲骨文.gif

鱼-甲骨文

今天逮到一只羊,就画一只羊

羊-甲骨文.gif

羊 - 甲骨文

去河边取了水,就画一条河

水-甲骨文.gif

水 - 甲骨文

鱼,羊,水,都叫做独体字。独体字就是最小具基本意思的汉字单位。比如:木,女,子,日,月,火,山,田,目,牛,马,等等,都是独体字。有人说汉字最小单位应该是笔画,我不反对。但对我来说,独体字作为汉字的最小单位会有很多好处,大家会在后面看到。

网上有信息说汉字独体字有400多,但没有给出准确数据。原因可能是比较难判断,因为,简体字中新创造了很多独体字,比如,电(電),书(書),术(術),专(專)等。但从繁体字的角度看不是独体字。简化字还把一些汉字摒弃了,比如,並字没有了,用并字代替。並字肯定是独体字,简体字没有了,繁体字有。所以需要专家专门研究制定标准,然后才有可能算出到底有多少独体字。但具体是450,或467,或480,对汉字的总体研究关系不大。我在这里就估算汉字的独体字为400多。

这些独体字是古人最先造的,它们都是象形字,就是用极简的线条描画出那个要表达的实体的形状。这满足了当时的一些表达,交流的需要。

独体字为汉字打下了最初的基石。

二,第一次飞跃:从独体字到合体字

古人有了可以表达有形状物体的象形字后,发现很多意思是没有形状的。比如,味道很鲜美,这个鲜是没有形状的,需要形状才能产生的象形字无法表达这个意思。怎么办?古人想到了用+的组合来表达:把鱼肉和羊肉一起煮熟了,那个味道就是鲜。用鱼和羊,应该是当时比较容易得到的,经常吃的鲜美的食物。

鲜 - 金文2.gif

鲜 - 金文(发现甲骨文)

用两个有形状的独体字组成了一个新字,它就是合体字,可以表达没有形状的意思。绝大多数形容词都是没有形状的,大部分动词也很难用一个固定的图像表达,但这些都可以用合体字来表达。比如:喜,烧,跳,看,投,等。可以是三个,或更多的独体字组成合体字,比如:搬,绑,滟,霸,等。

合体字就是今天所说的会意字和形声字。

这是汉字演变的第一次飞跃。古代中国人从只能表达具有形状的实体事物的独体象形字,到可以表达没有形状的意思的合体字,极大地扩展了汉字表达的能力和范围。

更多的组合例子。

 +  = 看;门 +  = 问;日 +  = 明;水 +  = 沐;田 +  = 男;水 +  = 泪;日 +  = 杳,杲,杳;日 +  = 旱;月 +  = 背;月 +  = 肚;。。。。。。

三,汉字表达的瓶颈

有了合体字,汉字表达能力大幅度提高,但仍然有很大的局限,尤其是复杂的意思。而且要表达的意思太多,而汉字太少。古人虽然尽可能的多造字,比如对于颜色,古人就造了:赤、朱、丹、红、赪、绛、绯、赫、茜、赧、赭、赩、赯、赮,等,以区别颜色的细小差别。但这样造字速度慢,任务浩大,而且表达颜色的汉字仅限于工匠,或者宫廷使用,而表达民间日常工作和生活的汉字仍然极度缺乏。

造字慢,需求大,怎么办?古人想到了一个办法就是借用已有的汉字。比如,造了樂(yue4)字表达音乐

乐-甲骨文.gif

乐 - 甲骨文(编钟组合)

但没有字表达樂(le4,就是快乐。另外造一个乐 (le4) 字?肯定也试过,但肯定没有成功。那就暂借乐(yue4)字来用,用发音的不同来区别意思。具体发生了什么,我们不知道。但是结果应该是,专门表达乐(le4)字没有造出来。暂借乐(yue4)就变成了长借,最后干脆接受了“乐“字一字多义,让其同时表示音乐的乐,和快乐的乐。这样需要造出一个新的乐(le4)字让人头痛的事就不用管了。

汉字的一字多义字很多,原因就是当年汉字不够被迫为之。上面的方法叫做“转注”,就是把另外一个意思加在一个已有的汉字上。

与转注相似的是假借,也是古人用来解决汉字不够的另一个方法。比如,它的原意是蛇,早就造出来了。

蛇-大篆.gif

它 - 大篆(没有甲骨文),原意是蛇

后来想表达它-代词,就是非人类的事物。但没有字来表达,有人就借用表示蛇的它来暂时代替。但后来的情况是它用作代词的时候多于表示蛇的时候,以至于人们常常搞混淆。为了消除混淆,就在它的左边加一个虫子旁变成蛇字,而原字它用来表示代词。就是我借了你的它(蛇的意思)来表示它(代词),现在我造一个蛇,还给你,但原字它我留下了。这就是“假借”。相对于转注的简单粗暴,直接把一个意思强加在一个字,而且有借无还,假借算是很有君子风度了,因为假借会还一个字回去,只是把原字据为己用。

转注与假借是六书中的两种,其他四种是,象形,会意,指事,形声。后面四种创造了新字,而转注是完全没有造新字,就是把意思强加于一个汉字上。假借则造了一个类似的字还回去代替原字(一般是通过加偏旁的方式),但把原字留下来了。

不论是转注还是假借,都是当时古人面对汉字不够时的应急之策,无奈之举,虽然解决了一些问题,但只是杯水车薪,帮助不大。

汉字急需第二次飞跃。

四,汉字的第二次飞跃:从合体字到词组

有了合体字,表达的范围虽然大大扩展,但仍然有很多意思无法表达,或者准确的表达。转注,假借有些帮助,但仍然不够,怎么办?

穷则思变,老祖宗最终想出来一个办法:组词。就是把两个或两个以上的汉字组成词组来表达意思。

比如, 

+ = 鲜美;

 +  = 明天;

 +  = 大红(茜);

 +  = 赤红

 = 彩霞(赮);

词组可以表达很多单字很难表达的意思:比如,窘迫,不顺,单相思,大难不死,不上不下,欲言又止,含情脉脉,等等。

组词应该是有一个漫长的时间才形成的,可能是几百年。我这里大大地简化了它的过程。

更多组词的例子。

独木桥,单身汉,一马当先,狼吞虎咽,美梦成真,弄巧成拙,走投无路,锦上添花, 。。。。。。

这些意思单字完全不能表达,或者非常困难,但词组就显得得心应手,游刃有余。

对于新事物,远古时代,出现一个事物,古人就试着造一个字去表示。但很多东西没有形状,或者形状不明显,造字都非常有挑战性。但我们有了词组以后,一切就简单了。

比如,出现了computer,画一个电脑造字? 不用。组一个词:电脑,很准确地表达了电脑的特点。有了train,画一辆火车造字?不用。组一个词:火车,也很准确,至少在当时来看。Laser,有形似无形,你怎么画?无法画。组一个词:激光,极其准确。出现了Internet,无形的东西,也不可能画,组一个词:网络。

更多的例子:AI – 人工智能,Telephone – 电话,Television – 电视,digital – 数码,washer – 洗衣机,dryer – 烘干机, kitchen fan – 抽油烟机,printer – 打印机,。。。。。。。

一个“机”就可以组合上百,甚至几百与机械有关的机器名称。一个“电”字也可以组合成几百与电有关的东西:电话,电影,电工,电车,电饭煲,电流,电压,闪电,水电,电工,电闸,电梯,。。。。。。。

从此汉字基本告别需要造新字来表达新事物的问题,因为用词组都可以解决。这是汉字的巨大优势。Google AI 说英文单词已经超过了一百万,仍然还在以每年上万个专业词汇的速度增加。这些词汇大多数与其他词汇没有关系。与之相比,收录汉字最多的《中华字海》一共收录了85568个,就是八万五千多,只有英文字典的百分之几,而且每年增加的新汉字趋于0

为什么说汉字基本摆脱造新字的问题,而不是完全摆脱?因为有些化学元素符号需要用单字,而不能用词组,所以需要造一个新字来表达新的化学元素。但这种情况很罕见,一般几年,十几年,甚至几十年碰到一次,而且越来越少。

在化学元素名称的汉字创造中,中国老一辈的化学家也创造性地把汉字的表意性特点融入了化学元素名称的汉字中。比如,氢,氦,氮,氧,氯,都有气字头,一看就知道是气体。碳,磷,硅,硫,都有石字旁,一看就知道是非金属固体。钠,钾,镁,银,都有金字旁,一看就是金属。

英文化学元素名称基本上没有这样的特征,你必须死记硬背。

五,汉字的“积木结构”和网络关系

如果我们把每一个独体字看成一个积木块,那么鱼,羊就是两块积木,它们可以拼出一个的积木组合。独体字是汉字积木的最小单位,它拼出的合体字是汉字积木结构的第二层。所以我把这种方式叫做拼积木,或者汉字积木结构。

下面是一个简单的汉字积木的组合,或说积木的拼法。

我们有两块积木:女 

女-甲骨文.gif子-甲骨文.gif

女,字(甲骨文)

我们先拼出来:好(合体字)

好-甲骨文.gif

好(甲骨文)

然后再拼:女子,子女,好女子,好子女,子女好,女子好,等新的词组。

当四百多独体字都来参与拼,我们先拼出八万多的合体字(字典上的字),然后可以拼出天文数字的词组来。这就是汉字的巨大威力和奇妙之处。就像集成电路,几个或十几个元件就可以拼装出不同功能的集成电路,然后再组装成不同的机器和设备。汉字的爆发性组合能力则更加强大,因为它是由四百多独体字, 加八万多合体字一起参与的类似拼积木的集合。

我把它叫做汉字的积木结构,从独体字到合体字就是一种积木的不同拼法的结果。从合体字到词组更是极大地扩展了汉字积木结构的表达范围。

这就是汉字的高效率。不但联合国里的汉语文件最薄,而且现在有报道,说AI用汉字运行比用英文运行效率提高40%。已经有专家预言,汉字将来可能会在AI领域大展神威。

理解汉字的积木结构对汉字教学也会产生革命性的变化。结合汉字象形,让学生先学会400多汉字的象形,或者其中一部分字的象形,然后通过拼积木的方法,扩大汉字的词汇。汉字学习从头到尾都充满趣味,逻辑,简单易懂,高效高能,学生可以永远告别死记硬背,汉语将成为世界上最容易学,最具内涵的语言。

构思于2025

完稿于222日,2026



Tuesday, February 10, 2026

为什么第二次汉字简化失败了?

八零年以后出生的人,可能从来没有听说过第二次简化字(简称二简字)。四十到五十的或许听说过,但可能对二简字只有模糊的印象。

什么是二简字?

二简字就是中国文字改革委员会公布的第二次简化字。几乎所有的人都知道简化字,但我们说的简化字,其实是第一次简化字,就是一简字。现在没有人谈二简字,好像历史上这事从未发生过。但二简字从1977年公布,到1986年废除,在中国作为官方正式文字存在过九年时间。当年的报纸,书籍,教科书,标语,牌匾都有过它的身影。但现在已经完全销声匿迹了,以至于大部分中青年人都不知道有二简字曾经存在过。

要谈二简字,就得先谈简化字的前世今生。清末时期,一直自我感觉良好,闭关锁国的大清皇朝突然发现自己是多么的脆弱,多么地不堪一击,被西方列强轻易打败,甚至被一直看不起的日本打得落花流水,被迫签了很多不平等条约,赔款割地,丧权辱国。为什么会这样呢?很多人,尤其是知识分子开始寻找原因。除了发现中国技不如人,比如大清还是木船,西方已经是钢铁造的舰艇。大清用的是大刀长矛,西方早就是火炮步枪。也有一些知识分子,在文化层面上找原因,包括鲁迅,钱玄同,周有光,等一大批知识分子认为汉字太复杂是造成中国落后的主要原因。鲁迅甚至喊出:“汉字不除,中华必亡“的口号。社会上要求简化汉字,走拼音文字的道路,最后废除汉字的呼声非常高涨。1919年五四运动后,这几乎成为当时知识分子的共识。有人就已经着手开始做简化汉字的工作了。

抗战爆发,加上后来的国共内战,汉字简化的事被搁置了。到了五十年代,中国政府马上开始了由政府主导的汉字简化项目。195517日,中国文字改革研究委员会公布《汉字简化方案草案》,从此开始了政府主导的强制推广简化字的全民运动。从开始的主要报纸试用简化字,到最后所有的报纸必须使用简化字,所有的教科书必须使用简化字。

一简字以行书字体为主,加上少量的草书字体。行书为了写快,把很多笔画连起来,甚至简化,所以行书字和楷书相比就是一种简化字。当时的知识分子从小用毛笔写字,都认识行书。现在把它楷化,没有认读的困难。一些知识分子对与汉字简化表示了反对,这些人在1957年基本都被打成了右派。从此再无人能公开自己反对的意见,成为一项必须执行的政策,基本算是政府强制执行的。

客观来说,因为一简字大多老百姓也曾经见过,甚至使用过,不觉得太突兀,所以抵触情绪不大。小孩读书,比我1964年上小学,没有繁体字的概念,直接教简化字,很容易就接受。

与此同时,汉语拼音的推广也取得了成功,不过这种成功主要是帮助学汉字,并不是达到可以取代汉字的汉语拼音化 - 五四时期知识分子想达到的目的。

政府接着准备二简字,进一步简化汉字。 

行书字体已经借用完了,二简字只能借鉴更多的草书字体,和极少见的异体字,有些可能就是专家们自己想出来的写法。大量的引入草书产生了认读问题,草书从来不是标准汉字,过度的简化和连笔,没有长期专门研究和习练草书的人根本就看不懂草书。自创的简化字更是没有任何社会群众认可的基础,自然在普通大众中存在巨大的认读障碍。

 19771031日,国务院批示指,《第二次汉字简化方案(草案)》可在《人民日报》及各省、市、自治区一级报纸上发表,‘征求广大工农兵群众和各方面人士的意见’,第一表的简化字‘已在群众中广泛流行’,发表草案后即先行试用“。

这个时间,正是77级高考前夕。全国人民的注意力都被恢复高考吸引,二简字没有引起人们的太多关注。不像一简字,“征求意见”的阶段只有一年就全面强制推行,二简字就没有跨过“征求意见“的阶段。原因可能是专家们也觉得心里没有谱,信心不足。加上开始改革开放,允许不同意见,不再把提意见的人打成右派,所以不同意见得以反映出来,一简字的强制执行就显得不合时宜了。

下面是当年一些报刊书籍上的二简字

 

《参考消息》

 

 

不明书籍

 

 

地理教科书

宣传画

 

下面是部分二简字表上的二简字。

 

上面是一对一对出现的,每一列的左边是一简字以后的标准汉字,右边是对应的二简字。

想了解更多的二简字,请点击下面的链接。

https://www.bilibili.com/read/cv11967889

刚开始的时候,所有报纸用二简字,看上去怪异且不舒服。二简字出现频繁的地方是街上的餐馆,标语,通知。我当年在北大读书,七七级当年没有教科书,我们都是教授刻的油印教材,里面没有二简字。79年以后有些教科书出版,印象中没有用二简字。我们基本上没有用过二简字,教授讲课板书也没有任何人用二简字写。

中小学教材应该是用了二简字,情况怎么样我不清楚。

应该是得益于当时宽松的政治环境,我们没有任何必须使用二简字的压力,所以大家都没有用。不知什么时候,外面的二简字也慢慢少了,报纸上的二简字也不知道什么时候消失了。

维基百科上是这样说的:

1986624日,二简字被国务院废除。 后《中华人民共和国国家通用语言文字法》规定二简字不属于规范用字。 随后,国家语言文字工作委员会重新发表了《简化字总表》,共计2235个简化字,只对1964年编印的《简化字总表》中的6个字做了调整,沿用至今。

二简字从出生到宣布死亡,大约九年的时间。宣布以后,全国波澜不惊。我周围没有任何人议论这件事。

二简字的废除宣告了汉字简化走到了尽头。拼音替代汉字因为同音字的问题,出现了不可克服的问题。从此汉字拼音化运动偃旗息鼓。

汉字没有被废除,但中国并没有亡国。当年认为“汉字不除,中国必亡”的精英们如果在天有灵,不知作何感想。


为什么拼音不能代替汉字?


我们看到“外婆的澎湖湾”,想到的是什么?是童年,是发小,是外婆的微笑,是天上飘着的风筝,是沙滩上的贝壳,。。。

如果写成“Wai Po De Peng Hu Wan你想到的是什么?什么也没有。如果拼音不好,

我们的唐诗宋词,通过汉字作为载体,尽显其优美意境。

白日依山尽,黄河入海流。

欲穷千里目,更上一层楼。

你想到的是:落日,大山,河流,大海,楼阁,极目天际的画面。书法就是将汉字的典雅与诗词的优美结合在一起而产生的艺术美,而且是有别于世界上任何其他形式的美。

如果写成

Bai Ri Yi Shan Jin, Huang He Ru Hai Liu. 

Yu Qiong Qian Li Mu, Geng Shang Yi Ceng Lou

你想到什么?什么味道都没有。

看到“天下第一关”大匾,你能想起什么?硝烟,万里长城,战马,匈奴,孟姜女,秦始皇,等。

如果换成“Tian Xia Di Yi Guan”的横匾,你能想到什么?什么也没有。

汉字饱含着文化,画面,历史,传统。拼音背后什么也没有。

一篇全是拼音的文章,不但失去汉字包含的传统文化,因为同音字的问题,一个音可能对应几个甚至几十个汉字,非常难搞明白文章中的拼音对应的是哪一个汉字,所以汉字拼音化这条路不可能走不下去。

再看前面提到的简化汉字的初衷,认为“汉字是造成中国落后的主要原因”,这个说法对吗?

从汉唐,直到北宋时期,一千多年,中国一直领先世界,万国来朝。用的是什么字?繁体汉字。近代经济腾飞的新加坡,香港,台湾,四小龙的三小龙用的是繁体汉字,照样取得了经济的腾飞。

非洲,拉丁美洲国家,用的是英语,法语,西班牙语,葡萄牙语,它们绝大多数国家都是贫穷的国家。

把汉字难写作为中国落后的主要原因,完全找错了病因。


为什么汉字简化也走不通呢?


汉字是世界上唯一存在的象形文字,具有艺术特性,所以我们有世界上独一无二的书法艺术。汉字具有艺术特性,同时又是语言。作为语言,汉字需要标准化,连贯性,稳定性,不然不可能成为社会沟通的语言,承前启后的文化载体。古汉字非常象形,极具艺术性,但为什么秦始皇要统一文字,就是语言必须标准化,才能作为交流工具。历史上汉字的正书(官方规定使用的文字)是小篆(秦朝),隶书(汉朝),楷书(唐朝),宋体字(宋朝),都是非常标准化的汉字,具有稳定的传承惯性。所以,现在即使是普通人也能看懂两千年前的隶书写成的文献。艺术则要求灵活性,创造性,多变性,标准化是它的敌人(千篇一律的字是没有艺术性的)。草书非常满足这些要求,所以它有极强的艺术性。但草书不能成为正书,因为草书缺少连贯性,稳定性,标准化,传承性,认读性很差(大众基本上不认识)。把草书楷化并不能解决这些问题,自然很难被大众接受。长期以来,社会包括精英并不清楚汉字的语言性与艺术性的区别,这方面的研究非常缺乏,所以才有想通过草书楷化来简化汉字的做法,当然不可能成功。

从象形的角度看,老祖先当年造字极为精妙,每一笔都有意义,任何删减都会造成字义的损害。

今天汉字电脑输入的普及,汉字难写已经不再是问题。二简字的废除是明智的,不然汉字将失去其特点,不能保持承传性,和文化根基。汉字的举世无双的象形是汉字的核心, 终有一天,人们会发现汉字象形的美妙绝伦。它不仅是华人的骄傲,也是世界的宝贵文化遗产。

 

写于2024712

 

 

 

汉字的独体结构

  正在准备出版新书” The Origins and Evolution of Chinese Characters -  A Pictographic Study Exploring Uncharted Territory in Etymology “    (汉字起源与演变...