有一段时间,朋友们热衷于去台湾玩儿,逛故宫看白菜啦,吃吃士林夜市啦,跑去垦丁住个民宿啦,大伙儿玩儿得是真高兴,夸了台湾很多好话。有人一时玩儿得兴起,入乡随俗学人家用上了繁体字。那天就看见有人深更半夜发了条微博“各位晚安,明天住哪裡呢?到那裡再說……”唉,这哪里是繁体字嘛,分明是错别字。“哪里”,走到哪里都是“哪里”,不论是用简体字的咱这儿,还是用繁体字的香港台湾;不管几百年前的明清,还是现如今。
现在简化字的一个“里”字,从根儿上来说,其实是繁体字系统里的三个字:里、裏、裡。“里”是个很古老的字,青铜器铭文里就有了,《说文解字》对它的解释是“里,居也”,就是人居住的地方。《周礼》说“五家为邻,五邻为里”,管25户人家的“里长”便是上古最基层的小官了。从居处的意思引申为地方,这里、那里、哪里,都是这个“里”。长度单位“一去二三里”也是这个字。
“裏”字跟“里”一样古老,《说文》解释它“从衣里声”,衣是形旁,里是声旁,“裏”意为“衣内”,我们今天说的“衣服里子”,便是这个字的本义。《诗经·绿衣》里有“绿兮衣兮,绿衣黄裏”,颜色搭得十分漂亮。至于“裡”倒是个很后起的字,大概宋以后才出现,只不过是“裏”的异体字,仔细看看字形,不过是“里”从原本被“衣”包裹着,变成了闪作一边,古人都很少用的。
从简化字这边来看,三字合一,用了个最简单的字形,的确是大大简化了。但若写回繁体,就必须仔细甄别,上下文指的是处所还是里外。“離鄉別里”和“屋裏屋外”要区分清楚。这种几个字合流的情况,还颇有一些,时不时见人张冠李戴,写出“恭喜髮財”、“天幹地支”,都别扭得一塌糊涂。就好像嫁到张家的两个媳妇归宁,本来该回李村的那个,硬塞给了王村,端的让人尴尬。
十多年前读研究生的时候,碰到有个学长做一个计算机文本繁简转换的项目,一时卡了壳找我帮忙。问题就出现在简体字转繁体字这一边,因为一对多的情况,计算机没法儿识别,正确率难以达标。386机的年代,我能想的无非是笨办法,把那些一对多的字挑出来,每个字都建个词库,把几个字分别对应的词尽可能罗列出来。把这个词库嵌入程序,计算机进行繁简转换的时候,以词定字,在一定程度上的确能提高正确率。但是汉语书写,一个字挨着一个字,计算机遇到“这里外国人很多”和“我这里外不是人”,还是不知道该用哪个“里”。
孔乙己早没了,可“里”的三种写法,依旧是个问题。