皇帝的新装 百度图书搜索玩笑开大了 晴

郝聪 , 2006/07/25 09:54 , 搜索引擎研究 , 评论(0) , 阅读(11254) , Via 本站原创 | |


更多



近日百度与中科院图书馆合作的消息让图书搜索这一话题再度升温,目前除了Google,微软也在极力拓展在这一领域的疆土。而在中国本土,除百度此前的国学搜索有点“图书搜索”的味道外,目前没有一家搜索引擎公司推出针对中国市场的中文图书搜索服务,据称谷歌的图书搜索已经进入内测,中国搜索引擎的老大百度又将如何应对?IT168软件频道将推出系列文章,也欢迎大家参与讨论。

浏览网络新闻,得知中文搜索的老大又出新闻了——百度与中科院图书馆合作重推图书搜索。然后当笔者兴致冲冲打开百度网页时,却发现所谓的“图书搜索”根本还就是空中楼阁。无疑在与Google
的竞争中图书搜索将会是一块争夺的阵地,但百度此番夸大其词的宣传只能让关注它的网民感受一次失望。对百度而言,目前图书搜索还只是一件“皇帝的新装”。

联手中科院,成就新领袖

关于这个新闻,稍加搜索就会发现,许多网站都转载了,这里只摘引两条。

先看《美通社 中文快讯》:

“继两个月前与亚洲藏书量第一的大学图书馆——北京大学图书馆宣布合作,近日,全球最大的中文搜索引擎百度在数字图书搜索领域又取得重大突破,与国内最大的专业图书馆——中国科学院国家科学图书馆签署战略合作协议……在此之前,百度已经陆续和北大图书馆、超星图书、书生电子、北大方正签署了在数字图书领域的战略合作。加上此次签约的中国科学院国家科学图书馆,百度合作的图书书目累计达到1500万册以上,科技期刊文献达到13000余种,使百度一举拥有了全球最大的中文图书可检索数量。”

再看《京华时报》的消息:

“百度和中科院合作后,百度免费在自己的搜索平台上,提供各图书馆馆藏书目的搜索服务。
在本次签约后,百度合作的图书书目累计达到1500万册以上,拥有全球最大的中文图书可检索数量。”

白底黑字,如果我没有看错,同时也没有理解错的话,这两篇新闻稿都报道了同一个事实:百度与北大、中科院等图书馆签约合作,提供馆藏书目的搜索服务,图书品种多达1500万册以上,而且已经“拥有了全球最大的中文图书可检索数量”。

1500万,一眼看穿的文字游戏

截止7月6日下午18时整,在百度搜索的“更多”页面里,找不到“图书搜索”的项目,也就是说,百度所宣称的中文图书检索尚未开通!

但是,上述两篇新闻稿都强调了同样一个“事实”:百度“拥有全球最大的中文图书可检索数量。”注意这句话中的“可检索”,“可”即表明已经存在。我相信不是发稿记者的笔误,如果是笔误,不会两家媒体的记者都错在同一个关键字眼上。很显然,这是百度提供的新闻稿,措词也应当是百度公关部门精心琢磨的。

新闻的“事实”与百度搜索的事实不相符合,那个“图书搜索”在百度的页面上连影子也没看见,谁能说这是无意之间弄出来的矛盾?

如果百度真的提供了“图书搜索”服务,而且真的“拥有了全球最大的中文图书可检索数量”,那么,新闻稿就不会出现明显的盲点。

请看,两篇新闻稿都提到了图书目录搜索,但是,根本没有提及,如何去实现搜索,用什么方法去实现,最关键的是如何去操作,一个字没提,甚至也没说这个东东什么时候可以使用。然而,新闻给人的第一个直觉就是,百度的图书搜索现在已经可以用了,而且可检索的图书数量非常巨大。新闻的盲点,是有意留下的,因为百度的图书搜索事实上不存在,让人无从用起。

显而易见,百度在这里玩了两个游戏:一个是文字游戏,以“可检索”的假象,忽悠用户信以为真。

另一个是数字游戏。新闻指出,“百度合作的图书书目累计达到1500万册以上”,首先要弄明白的是,1500万册,与1500万种,绝对不是同一概念。其次,要追究的是,“馆藏书目搜索”,是搜索品种,还是搜索册数?

据中国出版网统计数据,从1950年到2003年,中国内地出版图书(新版)共计1684198种。内地50年出版不图书品种不到200万种,建国前的图书流散很多,品种也很少,其他国家有关的中文图书数据目前还没有多少。超星扫描了中国200多家图书馆,也才扫描了130万种图书。所以,百度把几家合作单位的数字图书相加,得出“1500万册”的数量,其中相当多一部分肯定是重复的。

百度把图书册数当品种,自封了一个什么“全球最大的”,连图书检索平台都没有,即便拥有那么多的图书,并没都放到网上,怎么就是“可检索”了?如此造势,分明存心忽悠人罢了。一种图书馆藏可能会有几册甚至几十上百册,如果仅仅搜索相同的书目,对用户来讲又有何益?闲着没事,不如去玩游戏,搜索相同的书目,不好玩,也累人,更没用。

剑指谷歌,百度大玩新闻游戏

一个虚假的数字,一个虚无的平台,百度抢在此时玩一把新闻游戏,把尚未开通的图书搜索弄成了真实存在的假象,意在与Google赛跑,而且一心想超越对手。

《京华时报》的报道指出,“除百度之外,另一搜索巨头Google也正在加紧图书搜索步伐。Google也火速签订了四家图书搜索合作伙伴,分别是清华大学出版社、中国少年儿童出版社、高等教育出版社和中信出版社。”

这些描述也给人制造了一个假象,比如“今年6月后”、“Google也火速”,似乎是百度的图书搜索在前,Google是紧步其后尘的而行动的。事实上,Google于2004年就在法兰克福书展上开通了英文图书搜索,目前90%的美国出版社已经加入合作,在欧美国家非常受欢迎。在我国,Google的图书搜索于6月初正式启动,据悉,目前正在丰富数据,增加可搜索的图书,预计今年内中文图书搜索能够上线。

Google中文图书搜索在国内加紧布局,百度奋起而追,仓促忙乱难免,还没备战,就冲锋上阵了,故而顾此失彼。模仿不是绝对的不行,但是,仅仅是形式上的模仿,只能促使浮躁的心态更加浮躁。

事实上,百度一直在模仿Google,好在有所创新,才赢得了纳斯达克股东们的追捧。但是,百度的模仿有时显得太急躁。比如,Google推出一个学术搜索,百度紧接着就推出国学搜索;Google继成功推出图书搜索英文平台之后,在中国推出中文图书搜索平台,百度就赶忙着也上图书搜索。问题是,没有强大的技术支撑,是搜不出来那么大的数据量的,百度何时能兑现“全球最大的中文图书可检索数量”?太急于求成,对用户不负责任,会伤及自己的创新根基,从长远看无助于自身的发展。

两道难题:版权与模式

提供图书搜索,百度首先遇到的难题就是,如何规避版权风险?

从目前的消息看,百度的图书搜索只是目录搜索,不涉及内容,这样不会导致版权纠纷。但是,目录搜索对用户来说,有什么意义呢?除了极专业的人士,并无多大用处。

根据一位用户的体验,Google英文图书搜索是基于全文内容的,为了保护版权,用户在网上只能看要搜索的内容的前后几页,就好像我们在书店里面翻书一样。搜索的精确度很高,你键入某某人的名字,只要在线的图书中提到了这个人的名字,就可以搜索到。比如,有一本关于IBM的书提到李开复的名字,全书只有一次,用Google一搜就能找到。

全文搜索,要有足够的书能够供读者去检索,这对百度来说,不能说没有很大压力,而且需要一定的时间认真去做,绝不是急于求成可以办到的。

另外一个难题是,百度的图书搜索奉行什么样的商业模式?据我所知,Google的图书搜索已经建立了明确的商业模式,即,不找用户和出版社收取任何费用,主要是靠相关性很强的广告赢利。比如,用户在搜索图书的时候,会出现与其搜索结果有效的广告,可以吸引客户的广告投放。


近日百度与中科院图书馆合作的消息让图书搜索这一话题再度升温,目前除了Google,微软也在极力拓展在这一领域的疆土。而在中国本土,除百度此前的国学搜索有点“图书搜索”的味道外,目前没有一家搜索引擎公司推出针对中国市场的中文图书搜索服务,据称谷歌的图书搜索已经进入内测,中国搜索引擎的老大百度又将如何应对?IT168软件频道将推出系列文章,也欢迎大家参与讨论。
相关日志
Dedecms编辑器CKeditor更换为百度UEditor的方法
从12月百度算法变化预测2011年SEO方向
百度上线图片竞价排名 图片显示推广字样(图)
桥页SEO:网站自我毁灭工具
Google和百度网页搜索的查询参数解释
百度欲在中国复制“eBay+谷歌”模式
百度分词算法详解
百度中文分词算法分析之三
百度中文分词算法分析之二
百度中文分词算法分析之一
发表评论

昵称

网址

电邮

打开HTML 打开UBB 打开表情 隐藏 记住我 [登入] [注册]