重新认识「汉语拼音」 (影片文案)

重新认识「汉语拼音」 (影片文案)

春日起每早,采桑惊啼鸟。
风过扑鼻香,花开落,知多少。

《采桑》这首小诗作于 20 世纪 50 年代。也许,诸位耳熟能详的是它的另一个版本:

春日起每早,采桑惊啼鸟。
风过碧空飘幽香,花落知多少。

相比之下,大意没有变,汉字却多了一个。作者为什么要作出这看上去不必要的改动呢?原因并不神秘:这首小诗包含了现代汉语普通话中全部 22 个声母。较早的版本中没有零声母,作者改动之后将它加入声母诗。它的作者是中国现代语言学家、汉语拼音方案的贡献者之一,周有光先生。事实上,在「声母诗」创作的同时还有了一首「韵母诗」。这两首诗的创作旨在普及彼时刚刚创制的汉语拼音方案;而在今天,汉语拉丁化的标准在中国大陆已经成为共识,汉语拼音也早已成为小学学前和幼教的基础课。但正因了后一点,我们也或多或少地觉得汉语拼音有些小儿科。真的是这样吗?不论观点如何,这至少能成为我们重新认识「汉语拼音」的绝佳理由[0]

汉字,汉字文化圈的文字,一个硕大无朋的家族。放眼整个 Unicode 中日韩统一汉字区,仅仅是基本区就涵盖了 20,989 个字符。但就算是基本区内有现代汉语读音的汉字,其中也有相当一部分于我们而言还是不太熟悉。我们之所以无法立即得出一个陌生汉字的准确读音,是因为汉字的字形与读音之间并没有实际的联系——汉字缺少一套成体系的表音系统。负责任地讲,汉字本身是具有表音符号的。形声字就是汉字中唯一具有表音部件的类型,它的声旁就是表音部件。然而,这套符号既不成体系又不准确:汉字并非在同一时期由同一群人所创造,其中难免有地方音的影响;而且,同声旁的字在创制的时候读音确实相同或者非常接近,但随着上千年汉语发展的音变,它们的读音与曾经的同路人早已大相径庭。这使得相当一部分的形声字无法按照声旁表记读音,遑论根本无法表音的象形、指事和会意字。汉字亟需一套成体系的表音字母。

辅助性地为汉字记音的案例古已有之。试着翻开一本《康熙字典》,这两种注音方式处处可见:「霜」,雨字部,所庄切、师庄切,并音骦。末一种是以一字直接注音另一字的「直音法」,前两种则是分割与拼合字音的「反切法」。反切法较之直音法更为先进,用周有光的话说,就是「从不能分析字音发展到能分析字音,走到了语音学的大门口了」。还有一种方法受到了印度梵文的影响,创制了使用现成汉字的「三十六字母」。不过这套汉语字母只记声母、不记韵母,没有做到音素化,也没能形成一个全面的字母表,周有光言及其「设计水平接近日本早期的万叶假名」。因此,这最初的「汉语字母表」也没有像拉丁字母般被广泛应用,我们只能在各种韵书中一窥它的身影。汉字亟需一套成体系的表音字母。

时间快进到近代,欧洲人将拉丁字母传遍全球,中国也不例外。明清以来,形形色色的汉语或汉语方言的拉丁化方案不断出现。此之中使用最广泛、影响最深远的当属「威翟式拼音」,亦称「威妥玛拼音」「韦氏拼音」。这套汉字拉丁化方案是英国的第一位汉语教授威妥玛研发的,最初于 19 世纪中叶初步建立完成。英国外交官翟理斯在 1892 年于其编纂的《汉英字典》中进一步完善了这个方案,改定成我们今天看到的模样。威翟式拼音基于北京官话,编解码模型接近英语,于汉语拼音方案的使用者而言相当亲切,也是制定汉语拼音方案的重要参考。与前人的方案相比,威翟式拼音的系统高度有序、简洁且准确,在不到十年的时间内迅速传播开来,成为了第一个被广泛接纳的拉丁化方案。

辛亥革命推翻清廷建立民国,新的政府需要一套新的统一标准。它落实的成果之一就是 1918 年颁布的「注音字母」抑或「注音符号」。作为第一套法定的汉语字母,注音字母最大的特点就是它的民族形式。除此之外,注音字母弃用了长久以来的「声韵双拼」系统,改为「声—介—韵」三拼,大大精简了字母数量。然而,这种改革并不彻底,遗留了 8 个复韵母,没有做到音素化。虽然注音字母并未使用拉丁字母,它仍然对此之后的汉语语音学造成了深刻的影响,我们至今还在使用。本视频中所有的声母和韵母也使用注音字母表记。

民国初年亟待统一的不仅仅是汉语字母,还有汉语的标准音。1920 年代末,随着「京音派」的胜利,北京音取代了人造的「老国音」成为标准音,一套新的方案也应运而生:1928 年的「国语罗马字」,由赵元任、林语堂等人在 1925~1926 年间研制。国语罗马字是中国的第二套法定字母,也是第一套法定的拉丁化方案。国语罗马字不迁就外文的拼写形式,使得拉丁字母能更好地为汉语服务。但是,国语罗马字的拼写标调变化过于繁杂,甚至模糊了各个音素以及表记他们的字母之间的界限。这使得学习国语罗马字的难度不减反增,它的传播能力也相应地大打折扣。再之,战火连天的民国也无力将其普遍推行,国语罗马字最终成了少数知识分子的玩物。值得一提的是,林语堂本人在 1972 年发布了一套「简化罗马字」,但鲜有人问津。台湾地区在 1986 年将国语罗马字修改后颁布,称之为「国音二式」,沿用至今。

除了威翟式拼音和国语罗马字,近代中国还出现了北方话拉丁化新文字、耶鲁式拼音、简化威翟式拼音等等拉丁化方案,但影响力均不及前两者。

中华人民共和国成立后,中央政府设立中国文字改革委员会和拼音方案委员会,以吴玉章为代表的研究员们接手这个特殊而急迫的任务,为百废待兴的中国研究一套新的拉丁化方案。在此期间不断有民间人士寄来各种拼音方案的尝试,其中可不仅有拉丁字母:西里尔字母式、汉字笔画式、重修注音式、速记符号式、图符形式、数字形式甚至几种字符的混合形式。此中各种自造字母层出不穷,硬是把「拉丁化」搞成了「化拉丁」。可是,我们也不能就此贬抑这些对新式注音方案所作的探索,这些今天看来略显天马行空的方案也同样成为了制订汉语拼音方案的重要参考。学者朱文熊在 1906 年出版的《江苏新字母》中有言:「与其造世界未有之新字,不如采用世界所通行之字母。」这句话的意义在今天不言自明,但彼时诸多方案的设计者们并未考虑到这一点。所幸,以国务院总理周恩来和文改会主任吴玉章为代表的大多数学者支持使用国际通行的拉丁字母。1958 年,汉语拼音方案正式公布,成为了我国第三套法定字母、第二套法定拉丁化方案。至此,汉语拼音在中国大陆推行开来,终结了长期以来的拉丁化争端。1982 年,国际标准化组织正式通过了 ISO 7098 号文件,汉语拼音成为了普通话拉丁转写的国际标准。

历史的铺垫已经足够,下面我们将从声母和韵母两个方面解析汉语拼音。

声母是一个汉语音节的首个辅音。若音节以元音起始,我们则说它的声母是「零声母」。不计零声母,汉语中共有 21 个声母:ㄅㄆㄇㄈ、ㄉㄊㄋㄌ、ㄍㄎㄏ、ㄐㄑㄒ、ㄓㄔㄕㄖ、ㄗㄘㄙ。

汉语拼音的一大特点是采用了通常用来表记浊的塞音或塞擦音的 5 个字母 ⟨B⟩ ⟨D⟩ ⟨G⟩ ⟨J⟩ ⟨Z⟩ 来表示不送气清塞音或者塞擦音。由于普通话没有清浊塞音的对立、却把清塞音的送气与不送气区别开,利用这些字母不仅是拉丁字母汉语化的体现,也是提高字母使用率的举措。诸如威翟式拼音等等利用符号或者字母h表记送气音的拼式也得到了简化,同时避免了由符号脱落带来的混淆与误会。对于习惯汉语拼音的国人,这三个字母在大多数场合下代表的音素 [b] [d] [g] 从听感上说更接近不送气的 [p] [t] [k] 而非送气的 [pʰ] [tʰ] [kʰ]。但也正因为这一点,官话方言区的中国学生在学习其它采用拉丁字母的语言时,拼音的影响使他们常常无法正确发出浊塞音,造成了不小的麻烦。(好吧,我也曾经为此纠结了好久。)不过,在面对母语是英语、德语等等清塞音一般送气的人们时,这一点会为交流会话带来些微帮助。声母ㄏ表记软腭音 [x] 却用了字母 h 表示,也是基于听感的原因,虽然一些人并不这么认为。在现实中,ㄏ的音值在这个区域内游走,因人而异。

之后是ㄐ、ㄑ、ㄒ三个声母。他们体现了汉语拼音最大的特色:汉语拼音相当频繁地使用 ⟨J⟩ ⟨Q⟩ ⟨X⟩ 三个较少见的字母,还经常出现在词句的起始,和传统的拉丁文本相比格格不入;就算是 ⟨J⟩ 和 ⟨Q⟩ 出现频率较高的西班牙语,与汉语拼音比还是相形见绌。这三个字母表记的读音与大多数西欧语言的读法不同,于是出现了老外们对秦、全、谢、徐等等几个姓氏如何发音抓耳挠腮的名场面。这几个字母的选用也历经坎坷: 1956 年释出征求意见的「汉语拼音方案草案」造了几个新字母,然而因为不便输入和流通而迅速被放弃;之后,变读与不变读的问题也争论了许久。事实上,ㄐ、ㄑ、ㄒ来源于两套声母:ㄍ、ㄎ、ㄏ和ㄗ、ㄘ、ㄙ。先前,以ㄧ、ㄨ、ㄩ开头的韵母与ㄗ、ㄘ、ㄙ相拼形成的音节称为「尖音」,与ㄍ、ㄎ、ㄏ相拼则形成「团音」。在北京官话音系中,尖团音的对立在清朝末期被抹去,但仍然存在于诸多方言中。(検査完了して、異常なし!)汉语拼音无论采用哪种变读法都破坏了尖团音两者之一的一致性,于是两种变读方案都进了垃圾箱,拼音采用了三个不变读的专用字母。字母 J 的英语读音 [dʒ] 接近 [tɕ],遂用其表记声母ㄐ;声母为ㄑ、ㄒ的团音字是由一部分声母是ㄎ、ㄏ的字演变来的,而拼音编排完前述声母后还剩一个能读 [kʰ] 的 ⟨Q⟩ 和国际音标中原样的 ⟨X⟩,声母ㄑ和ㄒ就由它们代表了。

ㄓ、ㄔ、ㄕ三个声母在汉语拼音中写成了字母组合。字母组合亦称「多合字母」「多重字母」 “multigraphs”,就是排列在一起表示一个音素的多个字母。根据字母数量的不同,它们也能被具体地称作「双字」「三字」等等。汉语拼音在声母中使用了四个双字,分别表示声母ㄓ、ㄔ、ㄕ和ㄫ。特别地,汉语拼音还规定了这四个字母组合的「简便」写法。由于输入这四个字符非常麻烦,这个一点都不简便的写法在今天实质上已经绝迹了。当然,ㄫ在普通话中不能作声母,只能作韵尾。ㄓ、ㄔ、ㄕ三母的这种记法也与其后的ㄗ、ㄘ、ㄙ相应。声母ㄖ由于普通话中没有对应的齿龈音而取了单个字母 r。

声母表到此止步,但声母本身还没有。比如,周有光先生曾说:「由于韵头字母都出现在音节的开头,也就是出现在声母的地位,所以韵头字母可以作为声母看待。」需要注意的是,此处的「声母」是正字法上的,而非语音上的。方案采用了两个「韵头字母」⟨Y⟩ 和 ⟨W⟩,目的是使以ㄧ、ㄨ、ㄩ开头的韵母界限分明。由此可见,韵头字母只有正字法功能,并没有语音功能。然而,在《现代汉语规范词典》的【半元音】一条中却赫然出现了「语文」两个字的首字母。看来在解除韵头字母的误会上,我们还有很长的路要走。

韵母由三部分构成:韵头、韵腹和韵尾。韵母表按照韵头的「四呼」排列:无韵头的「开口呼」、韵头是ㄧ的「齐齿呼」、韵头是ㄨ的「合口呼」和韵头是ㄩ的「撮口呼」。

首先是呈现为字母 A 的韵母ㄚ。对于拼音中的小写字母 ɑ,现今大部分语言学论文与著作都采用了它的「单层」写法,小写字母 g 也不例外。这些字体排印上的习惯自汉语拼音发布起就一直沿用。它最初的目的是避免大众在手写时模仿仅在排印中出现的双层 ⟨a⟩ 和 ⟨g⟩ 的字形。虽然大多数涉及此处的作品避免了两个双层字母的使用、甚至视其为「错误」,但汉语拼音方案并未作出此类规定:「字母的手写体依照拉丁字母的一般习惯。」也就是说,在拼音中使用双层 ⟨a⟩ 和双层 ⟨g⟩ 并非离经叛道,关于字形的争论也是不必要的。

其次是两个戴帽子的字母。拼音规定以加扬抑符的字母 e 表示韵母ㄝ,但直到现在还有很多人不知道它的读音。这是因为它们的绝大多数在没有造成混淆时脱落了扬抑符,以至于复韵母中几乎所有的字母 e 都是ㄝ而非ㄜ。考虑到输入的便利性,单独的「ㄝ」往往被改拼为 ⟨ei⟩ 或者 ⟨eh⟩。诸多教材中并未出现这个字母,从注音ㄚㄛㄜㄝㄧㄨㄩ的顺序中删去了韵母ㄝ。另一个字母引起的麻烦要大得多:拼音 ü 上的分音符源出德文,但英文中没有这个字母。类似拼音 ê,由于能够合并的拼音 ü 都脱落了两点并入字母 u,强行脱去保留两点的拼音 ü 一定会引起混淆。有的甚至拿主流拼音输入法中的键位 V 代替这个字母,令人啼笑皆非。2011 年 10 月,国家标准 GB/T 28039-2011 文件作出规定:「根据技术处理的特殊需要,必要的场合(如公民护照、对外文件和书刊等),大写字母 Ü 可以用 YU 代替。」拼音 ü 转写的混乱现象就此终结。其实,汉语拼音的一个设计原则就是避免使用除声调以外的其它变音符号,这也是前面的两个字母常常脱去变音符的原因。

复元音韵母ㄧㄡ、ㄨㄟ、ㄨㄣ与声母相拼时,去掉中间的韵腹,记作 ⟨iu⟩ ⟨ui⟩ 和 ⟨un⟩。这种省略的原因在于它们的韵头在某些条件下发音弱化、甚至丢失。所有的齿龈音和卷舌音声母跟ㄧㄡ、ㄨㄟ、ㄨㄣ在阴平和阳平的音节相拼时,后者的韵腹有时会弱化和消失,比如「丢」、「纯」、「虽」;在上声和去声的音节,这些韵母更倾向于不丢音,就像「六」、「润」、「水」一样。拼音为了形式的统一和拼式的简化,采用了丢音的记法。

韵母ㄠ写成了 ⟨ao⟩ 而非语音学上更接近的 ⟨au⟩,是考虑到了手写时字母 u 可能会与字母 w 或字母 n 混淆。而韵母ㄧㄢ中的 [ɛn] 记作 ⟨-an⟩ 而不是 ⟨-en⟩ 则是出于避免与一直读 [ən] 的 ⟨en⟩ 混同。况且,ㄧㄢ其实来自韵母ㄢ而非ㄣ:[an] 音受韵头 [j] 影响口形稍闭, [a] 向元音表上方推移变成 [ɛ];类似地,ㄅ、ㄆ、ㄇ、ㄈ四母在后接ㄛ时受前者的唇音和后者的圆唇影响,在 [o] 前形成半元音 [w],bo, po, mo, fo 变成了 buo, puo, muo, fuo。注音和汉语拼音之所以没有写出介音ㄨ,是因为老派普通话的这四个音节确实读作没有介音的前者。

有两个韵母没被写进韵母表中。第一个被单列了出来,就是单韵母ㄦ。作为一个音节,它不能与声母相拼。这个韵母的实际音值尚有争议,不过就我而言,这种「争议」毋宁称作「因人而异」。作为韵尾,它形成了独特的「儿化」现象,拼音在这写作 ⟨-r⟩。关于儿化造成的音变在《现代汉语词典》的「凡例」中有详尽的说明,这里限于篇幅暂时按下不表。

至于其二……也许我们应该更深入些。

注音字母ㄓ、ㄔ、ㄕ、ㄖ和ㄗ、ㄘ、ㄙ其实代表两种语音:一种是单纯的辅音,另一种则是音节。那么,作为音节,它们的韵母分别是什么?这两个被称作「空韵」的韵母自从第一次对汉语音值的实测开始就在语音学界中激起了极大的兴趣。在此之中,最常用的两种记法分别写作两个成音节的近音 [ɻ̩] 和 [ɹ̩],与闭央和闭后不圆唇元音 [ɨ] 和 [ɯ]。从听感上说,空韵可以认为是持续的连续辅音或是成阻不完全、有极弱摩擦的响音;而从测得的频谱、气流与舌位——也就是「发声语音学」的角度来看:空韵形成之前,前置的辅音刚好完成除阻;紧接着,舌位不动,声带发声,空韵形成——却表明它是个元音。然而,[ɨ] 和 [ɯ] 的记法有致命的偏差:标准的空韵发声时舌面完全不参与调音,而把空韵记作任何一个简单的舌面元音就表示舌面参与了调音。先前,空韵的发音被称作 apical vowel「舌尖元音」,是因为它的有效发声部位在舌尖而非舌面。但正因为它的有效发声部位冲破了 IPA 定义中「元音」的范围,所以它的音值应该相当于成音节近音。瑞典汉学家高本汉特别为个空韵创造了个专门的元音记号,可是被国际语音协会拒之门外,迟迟未进入国际音标表。威翟式拼音区分了两种空韵的表记;而汉语拼音不然,顾及语音史,将同出一源的三个音用字母 i 的变读表示,合并了两个空韵,简省了拼式,但也增加了误读的风险,我们也只好单独记忆了。

从反切到注音,从威翟式拼音到汉语拼音方案,从无尽的交叉参考到精准的一音一符,汉语拉丁化方案的迭代不正是近、现代中国的写照吗?古老的汉语、年轻的普通话被一次次地予以拉丁字母的羽翼,泱泱大国的语言这才水击三千里而环抱世界。汉语拼音的出现虽晚,可它博采此前拉丁化方案的英华,规避前人的种种误区,是各方意见的最小公倍数。拼音并不是完美的,重新认识汉语拼音的意义所在,远非提示其并非识字工具那么简单;拼音依然是年轻的,它的历史使命也远不止于此。汉语拼音的漫漫长路,或许只是刚刚启程。

樂彼之園,爰有樹檀,其下維蘀。他山之石,可以為錯。
〈詩經 - 小雅 - 鶴鳴〉


 Notes 

[0] - 衷心感谢 UntPhesoca 细致的校对!


 References 

  • 《汉语拼音方案》. 中国文字改革委员会, 1957
  • ISO 7098:2015 Information and documentation — Romanization of Chinese. ISO, 2015
  • GB/T 16159-2012《汉语拼音正词法基本规则》. 中华人民共和国国家标准, 2012
  • 周 有光.《汉语拼音方案基础知识》. 语文出版社, 1995
  • 张 玉书、陈 廷敬 et al. 编, 王 引之 校.《康熙字典》. 2nd Edition, 武英殿, 1831
  • 张 中行.《文言常识》. 生活·读书·新知三联书店, 2014
  • Gɪʟᴇs, Herbert A.. Chinese-English Dictionary. 2nd Edition, Kelly and Welsh, 1912
  • 赵 元任.《赵元任语言学论文集》. 商务印书馆, 2002
  • 朱 文熊.《江苏新字母》. 文字改革出版社, 1957
  • 《各地人士寄来汉语拼音文字方案汇编》Volume 2. 中国文字改革委员会拼音方案部, 1955
  • 李 行健 et al..《现代汉语规范词典》. 3rd Edition, 外语教学与研究出版社 语文出版社, 2014
  • 吕 叔湘、丁 声树 et al..《现代汉语词典》. 7th Edition, 商务印书馆, 2016
  • GB/T 28039-2011《中国人名汉语拼音字母拼写规则》. 中华人民共和国国家标准, 2011
  • Kᴀʀʟɢʀᴇɴ, Klas B.J.. Etudes sur la phonologie chinoise. 1926
  • Lᴇᴇ, Wai-Sum; Zᴇᴇ, Eric. Standard Chinese (Beijing). Journal of the International Phonetic Association, 2016
  • Lᴇᴇ-Kɪᴍ, Sang-Im. Revisiting Mandarin ‘apical vowels’: An articulatory and acoustic study. Journal of the International Phonetic Association, 2014
  • 周 殿福、吴 宗济.《普通话发音图谱》. 商务印书馆, 1963
  • Dᴜᴀɴᴍᴜ, San. Chinese Syllable Structure. 2007

 Author 

重新认识「汉语拼音」 (影片文案)

https://vistudium.top/2022/06/23/enclosure02/

著士

Siphercase

作於

2022-06-24

協定