http://www.wangxiaofeng.net/index.php?p=1047
一个输入法的死掉
带三个表 @ 2007年04月03日23:06
以前看过一个广告,一个厨子对着电视说:“人家都问我炒菜的秘诀,其实秘诀在这里。”然后拿出一包味精。有一个特别好的辅助工具,可以帮助你事半功倍。
老有人问我为什么那么能写博客,写那么多字不累吗?诸如此类的问题,如果按照那个广告的思路,我可以拿出让我炫耀的资本,它不是博客生成器,也不是我的大脑,而是我多年来一直使用的输入法。它叫黑马输入法。今天之所以想说说输入法,是因为看到了一条新闻,“股沟”既搜狗之后,也即将推出新的输入法。对于这个新输入法,我不清楚,但是让我有兴趣下载了搜狗输入法。张朝阳吹牛逼说这个输入法的准确率可高达79%。
我装上之后,发现它和我一直以来使用的“黑马输入法”几乎无任何差别,我甚至怀疑,他们是抄的“黑马”。为什么这么说呢?这话还要从几年前说起。
我1996年买了第一台电脑,梦想着可以用电脑写字,但是,我发现让我适应电脑的最大障碍就是输入法,那时候没什么好输入法,字都要一个一个往里敲,后来用了“中文之星”,总算在Win32的时代有了相对比较快速的输入法。但是对于我这个才如泉涌的人来说,“中文之星”还是太慢了。五笔字型我又懒得去背,所以一直停留在拼音输入法上。在一个偶然的机会里,我看到一篇介绍“黑马输入法”的文章,我就去中关村黑马公司买了一个,当时的版本是2.0,装上之后一用,不错,终于可以跟我的思维速度合拍了。但是,有个问题一直让我很难受,因为我当时总写一些摇滚乐的文章,难免要提到一些外国人的名字,比如“迈克尔·杰克逊”,外国人名,常见的都是默认的,“迈克尔·杰克逊”你肯定不会打错,而且默认的值跟新华社出版的《外国人名译名手册》上面的标准差不多,可是麻烦的就是这个“·”,当时的输入法上面居然没有想到设置这个“·”。
有一天,我去中关村,找到黑马公司,向他们提出这个问题,他们很重视,所以在升级后的3.0的版本中,加入了这个“·”,只要按“~”键,在中文输入状态下,出来的就是“·”。这是黑马输入法的特别设置,别的输入法在打“·”都是按照微软的标准:shift+2,只有黑马跟人不一样,这显然是我的功劳,哈哈。
但是我发现,搜狗输入法里面的“·”也是按“~”键,我不知道他们是否跟黑马公司申请知识产权,或者这是一个巧合,或者我没有使用太多的输入法,比如紫光拼音、拼音加加之类比较流行的输入法,他们是否也是这样设置的。因为我在用了黑马之后,就再也没换过别的输入法,除非用单位电脑出差写稿子,才不得不使用“微软拼音输入法”,一般情况,肥皂我只用雕牌,手机我只用诺基亚,输入法我只用黑马。大家可以去帮我验证一下。
但是搜狗输入法让我很吃惊,它基本上跟黑马差不多了,我感觉它不是从黑马那里借用的专利,而是“独创”。在我用的黑马各个版本中,“3.0版本”是准确率最高的,当时我用这个版本打了一篇1000字左右的《人民日报》社论,大家都知道,这个报纸的社论基本上是集假话、大话、空话、屁话、废话、套话、瞎话之大成,整个社论打完之后,只有四五处错误,准确率之高令人发指。但是后来升级,我发现准确率下降,但能维持在90%左右,这已经是目前准确度最高的输入法了。
很多人会问,怎么还有准确率?因为这个输入法是整句输入,如果你用“只能ABC”,那顶多就是一个词一个词为单元,一般没有准确率的问题,而黑马是一整句,不管你想写一句什么样的话,它都能接近最准确的结果,部分重码在你把整句写完之后,在还没有上屏之前,可以调整修改。但是搜狗还没到这份上,但已经基本上能满足常规需要了。不过,搜狗一句话最多能打出32个字,而黑马可以打出79个字。当然,如果你不是一个现代派诗人的话,这个功能一般用不上。当然,黑马最新的版本“黑马神拼”有几个一直让我困惑的问题没有解决,比如我要打“为啥呢”,显示出来的一定是“为善恶”,而搜狗解决了这个问题。还有单引号(‘’),黑马也不能直接打出来,为此我曾经给黑马公司打过电话,希望他们解决这个问题,但是他们的回答让我很失望,这么简单的问题他们不能解决。
黑马已经有好几年没有推出新版本了,这么小的一家公司,似乎不研发没盈利的产品了,而且,黑马输入法是目前唯一的一个收费的拼音输入法,在都免费提供拼音类输入法的今天,黑马已经没有了竞争力。你会问,他们为什么还要卖钱呢,因为他们有一个所有输入法都没法比的词库,微软拼音输入法(最新版本)的安装文件有76兆,搜狗的也不过7兆多一点,而黑马输入法有400多兆,这么大的数据库里面装的是什么?反正你常见的一些词汇,里面都有了。这对于一个整句输入法来说,是必须的。他们想升级输入法,投入的成本是很高的,这么多年,黑马公司在输入法升级方面一直没有动静。
多好的一个输入法啊,眼看着被一些烂输入法替代掉。我觉得,黑马输入法的理念是对的,汉字输入法从字输入到词输入,再到句输入,是一个飞跃。严格意义上讲,搜狗并不是句输入,很多方面它跟十年前的“中文之星”差别不大。不知道马上推出来的“股沟输入法”会是什么样子。反正,不管再有什么新输入法,只要操作系统还兼容黑马输入法,我绝对不换别的输入法。
黑马输入法到底有什么优势,我打几句让你看看,比较一下黑马和搜狗,你就知道是怎么回事了。这些都是打出来默认的结果,我没有改动一字:
黑马输入法:尝一脔肉,而知一镬之味搜狗输入法:倡议乱肉,而至抑或职位
黑马输入法:车辚辚,马萧萧,行人弓箭各在腰搜狗输入法:车琳琳,吗小小,行人弓箭搁在要
黑马输入法:人生自古谁无死,留取丹心照汗青搜狗输入法:人生自古谁无死,留取丹心照汗青
黑马输入法:青青子衿,悠悠我心搜狗输入法:青青子衿,悠悠我心
黑马输入法:傻逼搜狗输入法:傻逼
黑马输入法:我辈岂是蓬蒿人搜狗输入法:我被歧视彭好人
黑马输入法:采采卷耳,不盈顷筐搜狗输入法:踩踩卷二,不应情况
也就是说,一些古文、古诗词,黑马输入法基本上没有错,因为它们都收录到词库里面了,而搜狗在这方面的劣势就很明显,它只能“记住”最常用的一些诗词。黑马对古代文字收录到什么程度呢?我这么说吧,《红楼梦》里面有一首关于惜春的诗《文章造化匾额》,这首诗估计没几个人能背出来,用黑马输入法打出来只字不差:“山水横拖千里外,楼台高起五云中。园修日月光辉里,景夺文章造化功。”而用搜狗输入法打出来的结果是:“山水恒拖欠例外,楼台高企乌云中。原秀日月光辉里,经多文章造化工。”所以说,在海外上市的公司都没文化。不过话说回来了,今天谁还能写出像《红楼梦》这样的文字呢?
其实黑马公司只要好好修复那些令人讨厌的Bug,在词库方面再增加一些新的词汇,在准确度上再提升一步,它就接近完美了。可惜了,这家小公司,看不出有什么后劲。眼看着一堆堆烂输入法的横行,他们一点办法没有。
黑马公司网站:这里。顺便提醒一下,网上能下载的都是试用版本,十多天后就不能用了,如果你想长期使用,最好去买一套,当时我升级花了25块钱,正版39块钱,也就两顿麦当劳的钱。
http://www.wangxiaofeng.net/index.php?p=1052
再说说输入法
带三个表 @ 2007年04月08日1:29
股沟推出输入法,被大家热评,好像以前任何公司推出输入法,都没有像股沟这样享受过被热烈关注的待遇,我没有安装股沟,因为我有股沟。但是看两个输入法的功能设置,我觉得没啥差别,唯一的区别是,你点击搜狗输入法显示条上面的“搜索”,它进入的不是百度或股沟,而是搜狗,我相信股沟输入法上面的“搜索”你点击之后打开的也不是搜狗或百度。果然,有人站出来说,连词库都是抄的。并且举了一个例子:“冯巩”,不管用搜狗还是股沟,必须打“pinggong”才能出现“冯巩”,打“fenggong”是出不来的。这种两个输入法相同的错误,据说还有很多处。由此可以证明,股沟抄袭了搜狗。因为出现了同类竞争,所以讨论的就热烈了。
阴谋论者总是认为,这背后有个黑手,于是,有人站出来,指责这个人是搜狗的走狗,又有一帮人站出来说股沟的坏话。我感觉这样拉锯下去,最后就会变成星巴克进故宫,目前一些傻逼民族主义分子还没注意,等他们掺合进来,性质大概就变了。
在我看来,搜狗也好,股沟也罢,都是多余的输入法,没什么先进的,凑合着还能用。人的思维方式是,你在写一句话的时候,脑子里首先想出来的是一个句子,你总是想到的是一个词,那你是结巴。但是输入法会让你把这些句子切碎成词,容易让人的思路也跟着断了,你的大脑一直在结巴。尤其是拼音,遇到重码,还要往下翻找。所以我为什么说黑马在这一点比较科学,它是整句输入,如果你再用双拼,速度可以提高好几倍。
没用过的人会说,400多兆,那么大,耗资源,速度慢。这都是胡扯,你在奔三的电脑上就可以运行自如,现在都双核时代了,我的电脑还是单核,奔四,从来就没觉得速度有什么问题。400兆对于今天的电脑算什么呢?你电脑里没有几部毛片么?没有几百首MP3吗?没几个游戏吗?这些东西占的资源也不少吧。没用过就别妄下断言。
要说输入法的问题,微软拼音和“只能ABC”的问题多了去了。但是有谁说过?大家都默认了,因为你必须使用微软,但你不一定非要使用股沟或搜狗。于是在技术问题上,就出现了争执,说白了,这是两家公司的竞争,某后到底有什么不可告人的交易,我不懂,但我觉得挺无聊的,商业层面的事情,往往会被傻逼们上升到爱国主义的高度,就像前段时间麦当劳使用小时工一样,你觉得卖当劳违反劳动法,那么,如果按照衡量麦当劳的标准衡量一下国企,有几个可以过关的,你说人家的食品里有苏丹红,大惊小怪的,我们随便一家饭馆的卫生条件跟人家差远了,入口的东西有多少是安全的,这些危险比起苏丹红要严重得多。但是谁注意过?但如果你是大企业,就一定要把你置于死地。我在想一个很简单的问题,如果麦当劳真的那么恶劣,它能全世界遍地开花么?
我希望看到一些关于这两个破输入法技术层面的讨论,以推动汉字输入的合理性和科学性,提高打字效率。当然,这两家公司的目的绝对不在这,而是重点推广它的搜索引擎,所以我说这两个破输入法多余。而因此引起的争论,我觉得更无聊,跟争论苏丹红一样,都带着一种仇恨。
股沟公司的公关公司的人跟我联系,感谢我对股沟输入法的关注,我特诚实地说:我说了一堆坏话。人家似乎对你说什么话不在意,在意的是你说了。这就好比以前总有唱片公司的人找我:“求你骂两句。”你说这操性的公司,能做出什么好东西。据说股沟的口号是“不作恶”,但你总得有点廉耻心,弄一个输入法,也花不少钱,就弄得好一点,别跟搜狗那样没出息。
我坚定地使用我用了10年的黑马输入法,尽管它还有很多问题,但是摸了十年,也摸出了感情。最主要的是,这家公司是专门给报纸研发校对软件的,汉字词组的准确率相当高,我不敢说是百分之百,因为我国的语言工作委员会的人对有些词都拿不准,很多时候它让你输入的时候很放心。
我们看看搜狗修正的词库:胡涂(糊涂)、倘佯(徜徉)、份量(分量)、伏罪(服罪)、蝴碟(蝴蝶)、卤莽(鲁莽)、希罕(稀罕)、旁徨(彷徨)、余辉(余晖)、伏输(服输)……括号内是修正后的词库,我用黑马把这些词打了一遍,没有错的。那么,在它修正之前,它起到的就是误人子弟的作用。我没有用股沟输入法,谁用过不妨打出来试试,看看有没有错,或者在你平时使用过程中出现哪些明显的“通假字”现象。
没文化就是没文化,在输入法上也能体现得一清二楚。就这种错别字的水平,顶多也就是小学四年级的文化程度。也许你会说,不就是一个输入法么,没完没了的,黑马给了你多少钱?一般智商跟黑猩猩一个级别的人确实会这么想,但是,输入法从某种意义上讲它就是本字典,人们都相信它是正确的,就像以前人们都相信报纸上说的话都是真的一样,你不能把判断真伪的权利交给使用者,让每个人都变成专家,要是那样,不就跟消费者打假一样了吗,那样还要工商局干什么?咱们国家好不容易把文盲扫没了,几个破输入法又增加一些新文盲,你说这样国民素质怎么提高呢?
所以我特别讨厌IT里面互相攻击对方的弱点的做法,不喜欢挑毛病挑不点子上,就算你是为了你们的搜索引擎弄出一个输入法,总得对使用者负责,搜狐公司没有“不作恶”的口号,因为所有中国IT企业都在做恶,所以可以放纵自己去糊弄大众,在他们看来,一个输入法没什么,所以出点这样或那样的毛病,也属于正常。就像张朝阳的某颗牙齿与众不同一样,人们不介意。但是文字这东西又是很标准化的,你在推出来之前就应该把错误都尽量扫干净。以前流行一个词:斑竹,就是“版主”,为什么斑竹这个让人摸不着头脑的词流行了,就是因为当时人们都习惯用“只能ABC”,这个傻逼输入法里面没有“版主”,但是却有“斑竹”,于是人们图省事,就用开了。“斑竹”的故事是电脑时代很典型的例子,有很多词汇被创造出来又死去,而这个创造往往是由于人们对文字使用的不严谨。对于个人来说,不严谨是自己的事,对于一个输入法来说,不严谨那就是作恶。
http://www.wangxiaofeng.net/index.php?p=1058
三说输入法
带三个表 @ 2007年04月11日1:23
如果我愿意,我会不停地说下去,直到烦死你们,谁让我用的输入法快呢。
我说了几句搜狗或股沟输入法的坏话,引来一些人的争论,大大在我预料之中,这年头,当你想说一些知名度较高的人或物的坏话时,你一定做好被人扔板砖的心理准备,心理素质差的人,就会像杨丽娟她爸爸一样。但是我比你还混蛋,我不管你丫是谁,你出毛病我就要说说——只要我愿意。
其实搜狗和股沟就是王菲和周杰伦,知名度高,粉丝居多,总有很多人前来维护名誉。今年有个美国记者采访我,上来就扔过来一个问题:你写博客没遇到什么麻烦吗?然后用一种异样的表情等着我回答。如果我说我被公安局抓进去过一百多回,估计就会成为明天他们报纸的头条。我的回答让他很失望:“从来没有。如果说真正有什么麻烦的话,那就是有一些智商跟黑猩猩一样的傻逼粉丝到我这里证明他(她)跟黑猩猩差不多,有时候看着挺烦人的。”好在我已经习惯了,有人愿意证明他是个傻逼,那就让他自证好了。
关于这“狗歌”(搜狗和谷歌的简称)输入法,我第一篇文章里提到这是两个“垃圾输入法”,不管他们怎么改进词库,都是垃圾。我觉得,对于像我这样坚持使用黑马输入法的人毕竟是少数,但是,在此之前的拼音加加和紫光输入法我都用过,基本上已经很成熟了,“狗歌”先后推出完全是多此一举,但是他们非要这么做,你只能怀疑他们的目的根本不是提高输入效率,而是让他们的搜索引擎无所不在。这也是作为两家搜索公司干吗不把黑马买下来的原因,他们不是干文字校对的,买下来干吗用呢?
还有人说我不懂技术,没错,我知道C代表碳元素,C+代表碳离子,就是他妈的不知道C++代表什么,三个代表我就知道两个。谈技术,我的确外行,但是,我是把各种输入法一路用下来的人,我的工作就是打字,什么好用什么不好用我还是有亲身感受的。我看了很多人留言,让我想起了现在大家忙着怀念的王小波的一篇文章《沉默的大多数》。的确,跟王小波在世的时候相比,很多人不沉默了,因为有了互联网,说话容易了,每个人都可以发表自己的看法,不管你是爱因斯坦的智商还是黑猩猩的智商,都可以在一个舞台上说话。如果王小波说的“沉默的大多数”是指在一种政治背景下丧失、放弃表达权的人,那么今天在喧嚣的互联网上,在喧嚣的现实中,那些“喧嚣的大多数”只不过是被商业驯化成奴才的另一类“沉默的大多数”,他们连最起码的判断都丧失了,他们成了品牌和广告的奴隶,被商业牵着鼻子走。开始我还困惑为什么向别人推荐一个更好的东西会引起人们的怀疑,现在明白了,商业是另一种宗教,没有布道的人,但你不知不觉就被催眠了,还觉得骑上了哈里·波特大的扫帚。
如果在没有“输入法抄袭”的背景下,我介绍黑马输入法,人们反应不会这么激烈,因为我以前就在博客里介绍过这个输入法。但是有这个背景,效果果然不同了,有很多网站都转载我的这两篇文章,连新浪的技术频道的编辑都打电话要转载,要是搁往常,我一口拒绝,但这次我二话不说,同意,我连稿费都不要,不过要转载别的一个字5欧元。你看,这次我没有站在作恶和不作恶的任何一边,结果两边都向我开炮。我虽然不懂技术,但是我老人家也做过IT记者,IT行业什么操性,我还是比较清楚的,这是一个媒体与产业狼狈为奸的行业,以前我老觉得娱乐圈脏,娱乐圈的脏也就是你看到的那些,基本上浮在表面,用他妈电脑术语讲叫“所见即所得”,太深了也没什么了,但是IT圈的脏是在一种美丽的外表下的脏,太有欺骗性了,以前我还看IT报刊,自从我做了IT记者之后,到现在我再没看过任何一份IT报刊,觉得用手一碰都容易得非典,在这种肮脏的氛围内,你看到听到的,还有什么可信度呢?但是业内已经把这个游戏规则玩得很正常了,不就是联手糊弄老百姓吗,不就是从愚昧的大多数口袋里掏钱吗。然后他们培养出来的大多数会是什么样子呢?这些人可能一面看着王小波的书,发誓做一个特立独行的人,一面真的像头蠢猪一样加入到起哄架秧子的行列。
当搜狐公司站出来讨伐股沟的时候,我想起了一个寓言故事,一只螳螂举起力爪,准备结果眼前一只蝉的性命,这时一只黄雀跟在后面,准备用锋利的喙啄死这只肥硕的螳螂,但是戏剧性的场面出现了,蝉回过头,看到了准备向自己头上砍去的螳螂,慢悠悠地说:“你想干嘛啊?回头看看,谁吃谁呀?”螳螂回头,见黄雀蹲在身后,还没来得及解释,便被一口吃掉。我觉得搜狐就是那个螳螂,他们以前没少抄过别人吧,这次理直气壮,其实他们脖子后面也发凉。我们可以想象,在黄雀后面,可能还有只老鹰,在老鹰后面,可能还有只老虎,老虎后面可能还有个猎人,猎人后面可能还有个想不劳而获的人拿着刀子准备结果猎人的性命……它变成了一个完美的食物链,这就是当今中国的IT产业。
中国的IT产业是什么呢,其实跟福建某个村子生产破运动鞋没什么区别,都是在做低级劳动,具体就是复制和装卸。联想集团是中国数一数二的IT产业,不就是一群装卸工吗,别老拿高科技蒙人,我们以前好不容易弄出个芯片,不还是假的吗。更多的“高科技”产业干的都是低级事情,有多少是自主知识产权的?都是抄来抄去。百度抄股沟,股沟抄搜狐,搜狐谁都抄……外国有个什么新模式,我们就毫不费劲抄过来,要说IT产业没什么新鲜呢,都是拾人牙慧。硬件方面更差,就是攒劣质电脑。
往大了说,中国不重视高科技,人才都外流了,但是我们又需要高科技,所以只好靠欺骗。往小了说,“狗歌”输入法恰恰说明了IT行业真的没什么大能耐,就是小孩过家家那一套,在一些底层面上争来争去,也就是黑猩猩抢苹果,高级的东西他们哪会啊。看看你们电脑里装的各种软件,国产的软件都是小打小闹的,大的软件有几个是国产的?
我很佩服当年的求伯君,他就是想弄出一个WPS,逼着微软的OFFICE在中国市场改变策略,但是金山的蜕变,恰恰是中国IT产业低层次的缩影,你看他们现在弄的都是些什么破软件啊。
股沟这次作恶,我倒觉得很正常,自从他们把“Google”改成“谷歌”,不仅意味着它本土化,也意味着它开始作恶,因为在一个作恶多端的IT行业,你不作恶,就会饿死。股沟的作恶不是堕落,而是必须向堕落的大多数看齐,加入到这个游戏规则之中。然后大家都变成狗,狗咬狗一嘴毛的游戏才能继续下去。
2007年11月3日星期六
珍藏精品——黑马神拼(不许联想博客转载)
订阅:
博文评论 (Atom)
没有评论:
发表评论