过去二十年,无数中国人学会了使用电脑后,都患上了一种“病”:提笔忘字。
对着一张白纸,脑子里想的字呼之欲出,却怎么也写不出来。
病根大家都知道:拼音输入。
拼音输入是一种真正的“无记忆、无障碍”的输入法,几乎统治了现在的汉字输入法市场。
但是很少人知道,在90年代以前,拼音输入根本没有市场,“以形为主”的汉字输入法才是主导,那个时候,学电脑就是学WPS和五笔字型。
那拼音输入到底是怎么发展起来的呢?
0 1
明快打字机
之前看过一个中文键盘输入法的搞笑图:
这幅图充分说明了中文输入的难点:字符实在太多了,常用字就有3500个。
所以,中文信息处理的前辈们考虑的第一个问题就是,如何用较少的键来处理更多的汉字。
20世纪40年代,著名作家,《京华烟云》的作者林语堂发明了一个叫做“明快”的中文打字机。
他自创了一种“上下形检字法 ”,放弃了笔顺,只要知道一个汉字的左上和右下部分,就能完成输入。
但是汉字众多,只靠左上和右下的部分,可能会出现同样结构的字。
林语堂就把这些同样结构的字放到一个叫做“魔眼”的窗格中,用数字的方式来选取。
对于一个字来说,需要按三次键:首钮,末钮和数字键。
林语堂把打字的过程变成了一个搜索的过程,这已经有了点现代输入法的雏形。
这个小小的、机械结构的打字机,竟然承载了8000多个汉字,可以想象,背后的设计和编码都是非常巧妙的。
实际上,从酝酿想法到做出来,明快打字机花费30年之久,耗资12万美元(40年代,这是个天文数字),林语堂甚至卖掉麦哈顿的房子,背负了一身债务。
1946年,林语堂向美国专利局递交了专利申请,开始寻找可以生产打字机的公司,雷明顿打字机公司表示了兴趣,邀请林语堂去做一次演示。
悲催的是,像很多伟大产品的演示一样,尴尬的事情发生了,按下打字机的一个键时,机器没有反应。
故障虽然容易解决,但林语堂失去了和雷明顿打字机公司合作的机会。
林语堂四处奔走,利用自己多年积累的全部关系网来推广,依然没有公司敢于冒险生产这个复杂的机器。
这个天才的机器就这么夭折了。
0 2
SinoType
如果说林语堂的明快打字机还需要独特的键盘的话,那么1959年问世的SinoType则率先实现了用QWERTY键盘来输入中文。
SinoType的发明人是麻省理工的教授考德威尔,这是一位逻辑电路设计领域的顶尖专家。
考德威尔刚开始并不懂中文,在一次和学生的聚餐中,学生李凡向他解释说汉字书写有一套标准的笔画,当不同的人书写同一个汉字时,使用的基本笔画是相同的。
也就是说,中文是有“拼写”的,中国人总用同样的方式来拼写一个字。
考德威尔立刻意识到,他可以建立一个逻辑电路来控制这个过程。
考德威尔和李凡等人研究了中国古代的书法历史,确定了使用21个基本笔画,然后又分析了每个笔画出现的频率,这样在电路设计中,可以把最短的编码分配给最常用的笔画。
每个笔画,在键盘上都有一个键来对应。
例如想输入“牛”,需要按GBBD。
但问题是“午”,也是GBBD,为解决同形异义词问题,考德威尔像林语堂那样,用数字1,2,3来选择。
SinoType计算机的测试结果也令人振奋,在键盘上练习20小时以后,中文输入速度可以接近英文打字速度。
考德威尔进一步研究发现,很多时候,对于多笔画的汉字,操作员通常只需要输入几个笔画,SinoType就能匹配到正确的汉字!
汉字的“最小拼写长度”实在是惊人,只要达到最小拼写长度,实际上就可以锁定键盘,不用输入了。
考德威尔在不知不觉中发明了“自动完成”的功能。
1960年考德威尔猝然离世,SinoType失去了首席科学家,更重要的是,五角大楼认为,作为宣传战的武器,“Sinotype”的杀伤力还不够大。
没错,在冷战时期,SinoType被赋予了意识形态斗争的重任。
造出了原型机以后,SinoType被束之高阁。
0 3
牛棚中的发明
支秉彝曾是留学德国的博士,电信工程和测量仪器专家,曾任上海市电工仪器研究所所长。
1968年,他被诬为“反革命学术权威”,关进“牛棚”,那段时间,陪伴他的只有墙上的八个大字:“坦白从宽,抗拒从严”。
支秉彝怔怔地看着这八个字,骤然间萌发了一个研究想法:能不能把汉字编成一种有规律的代码,用以替代打电报的老办法?
更进一步,能不能进而让汉字同西文一样直接进入计算机?
支秉彝凭早年在德国任教汉语的根基,潜心思考,运用26个字母逐个编码汉字。
当时,支秉彝手头有笔,却没有纸,就利用茶杯盖子,几十个汉字编满了,抹了再编。没有字典,就凭记忆。
1969年,支秉彝离开“牛棚”,去劳动改造,扫地,看守仓库,闲下来的时候继续研究编码。
之前无论是林语堂“明快”还是考德威尔的“SinoType”,他们都喜欢以字型为基础进行分析和分类。
但是支秉彝有了一个全新的武器:汉语拼音。
新中国成立初期,我国文盲率达80%,为了能迅速改变落后面貌,中国开展了汉字简化、推广普通话和制定推行汉语拼音方案三大任务。
1958年,中国公布了由汉语拼音方案委员会制定的《汉语拼音方案》,并迅速在全国推广。
拼音的诞生,不但开启了“语同音”的时代,也为汉字输入提供了全新的思路。
他仔细研究和总结了国外编码方法的优缺点,创造了打破单一分解汉字字形的方式,与众不同地综合分析汉字字音、字形、笔划和拼音之间的关系。
关键是用26个字母进行编码,以4个字母表示一个汉字,规则简单,易于掌握。
如“路”字,可拆成口、止、文、口四部分,取部首拼音读音的第一个字母,即组成“路”的代码KZWK 。
这种编码方案建立在字音和字形的双重关系上,见字就能识码,见字就能打码,不必死记硬背,并且可以用普通键盘来输入。
1978年,支秉彝发布了他的“见字识码”系统,引发国内轰动。
1983年,上海仪器仪表研究所以“支码”为基础,为全国50多个单位提供了电脑汉字信息处理技术和设备,标志着我国电脑汉字信息处理进入了应用推广阶段。
0 4
林语堂的“明快”打字机和SinoType采用的是字形检字法,支秉彝的“支码”用的是字形拼音结合法,这么发展下去,简单易学的纯拼音输出法应该出现了吧?
其实并没有,拼音输入法最大的问题是重码率高,每个音节都有数十个备选!
记得早期的智能ABC输入法,那叫一个慢,每次输入完毕,还得手工翻页选词,极其麻烦。
解决这个问题的办法就是用词库来保存各种各样的词,短语,这样就能从打字变成打短语,甚至打句子。
然后,即使是最基础的词库,也需要几百M空间来保存,那些包含专业术语、网络用语和口音变体的词库,更是高达几个G。
80年代和90年代初期,电脑硬盘都很小,也就几十M到上百M,是没法玩儿拼音输入法的。
所以,还是折腾字形吧。
同样在1983年,一个仅仅占用几百K空间的输入法问世了:五笔字型。
它的发明人是河南南阳人王永民。
五笔字型不仅小巧,而且打字速度超快,它键码短、输入快,多简码,一个字或一个词组最多只有四个码。
普通人每分钟可以轻松达到120~140字,而专业人士可以达到200字以上。
在"五笔字型全国大赛"中,在"错一罚五"的严厉比赛规则下,21岁的女孩王君创下了每分钟输入293个汉字的世界记录,人眼一分钟也就能看300个字左右,王君的录入速度已接近人眼浏览极限。
五笔字型唯一的问题是:学起来太难!
用户得掌握拆字技巧,记住口诀,然后反复练习指法,很费时间。
但是,80年代计算机还是绝对的“高科技”产品,它的使用者多为办公人员或专业技术人员,这些人对输入效率要求较高,愿意花时间学习五笔字型。
五笔字型虽然学习门槛高,但掌握后回报率极大,所以五笔就迅速成为输入法领域的老大了。
那时候一说学电脑,就是学WPS,加上五笔字型,各位文印店里的电脑五笔字型是标配,那些年轻的打字员双手翻飞,打起字来劈里啪啦,蔚为壮观。
0 5
拼音称霸
90年代后期,电脑配置越来越高,像我第一台电脑,已经有了4.3G的硬盘了,拼音输入法所需要的字库慢慢不再是障碍。
2000年3月,紫光拼音输入法推出了最新版,共收录了8万多条名词、短语、地名以及人名等词汇,一经发布便受到广泛好评,并迅速普及开来。
2006年6月,马占凯创造性地把搜索和输入结合起来,推出了搜狗输入法,它通过搜索引擎技术,将互联网变成了一个巨大的“活”词库。
“活”词库可以随着热点不断自动更新,以往的输入法都打不出那些词,搜狗输入法都能搞定。
这种互联网的思维方式,搜狗输入法得以后来居上。到了2009,搜狗输入法竟然占据了80%的市场份额!
后来,QQ输入法,百度输入法,Google输入法层出不穷,但无一例外,走的全是拼音的路子,五笔字型慢慢收缩到了专业人士使用的领域。
至于它们搞弹窗广告、捆绑软件之类的恶行,那是后话了。
从字形到拼音,中文输入法度过了40多年的时光,技术的发展给人们提供了便利,也带来了提笔忘字这种普遍的现象。
未来会怎么样呢?
刚才,我看到孩子对着手机在说话,她正在用语音输入写一篇文章,这也许就是未来的趋势吧!
参考资料
《中文打字机》
《汉字王国》
《THE CHINESE COMPUTER》
《中国工程师史 第三卷》汉字编码技术的创立者
热门跟贴