本文部分内容发布于2015年12月15日《环球时报》,题为《做大搜索引擎唯有走出去》。本文为作者原文。
百度血友病贴吧被卖事件形成蝴蝶效应,虽然百度及时出台政策期望平息,但是依然激起全民对百度的抨击和愤怒,各种批评文章几乎刷屏。中国互联网公司的商业底线和社会责任感沦落到这个程度,惊到了很多人。看到有人截屏有“百度贴吧之父”之称(2009年离职)俞军的朋友圈留言:“你们怀念我,我怀念Google。如果外部压力不够,我回百度也是独木难支。百度的核心问题首先是价值观,然后是激励机制”。我忍不住评论道:“一语中的!百度问题的核心。还是曾经的自己人最了解问题的根子在哪里?价值观的缺失,却让百度走到了今天。但是,问题总有一天会全面爆发。关键词卖了,贴吧卖了,百科词条也卖了,对百度来说,还是什么不能卖的?一个企业的灵魂也在这一单单生意中卖掉了。价值观,听起来如此虚的一个词汇,可是对于一个巨头来说,这就是唯一的生命线!百度,不能永远当中国互联网界的煤老板!”
下面的问题和文章,写在本次事件之前,但是核心的分析完全适用。
网友提问:方老师,中国需要有好的搜索引擎吗?(很多人说放开谷歌就可以了)中国为什么没有好的搜索引擎?(封闭?官办?缺乏互联网思维?)好的中国搜索引擎什么样?首先,一个好的搜索引擎对学术的作用是不言而喻的。但是国内的百度,知网都没有像谷歌那样好用,尤其是很多人批评,百度搜索搜出的更多是广告。一些人认为,在谷歌花了大量人力物力的情况下,中国没有必要再搞搜索引擎,封闭谷歌是把自己跟国际学术界隔开。像即刻搜索那样的失败,正好证明了中国在官僚思维下搞不成好引擎?
最近关于谷歌回归的消息不绝于耳,引起网民热议和兴奋。但是,可以确定的是,即使谷歌回归中国市场,也主要是安卓(Android)系统相关的业务,中国网民最为渴望和期盼的搜索引擎并不在谷歌回归的计划之中。对于普通网民来说,搜索引擎不回归,谷歌就相当于没有回归,依然难以缓解广大网民之痛。
在浩瀚的网络空间中,搜索引擎是互联网最早诞生的应用之一,也是我们获取信息的第一工具,迄今全球网民的第一入口,其重要性如何强调都不过分。但是,作为全球最大的网民群体,最大的悲哀在于迄今中国无法享受全球最好的搜索引擎。尤其是中国知识界最感痛楚:谷歌主动退出中国之后英文搜索就缺乏相应的替代,中文搜索因为国内市场过度商业化其质量实在差强人意,实在让网民无法满意,而官办和市场化的第三梯队纷纷折戟或者差强人意。搜索引擎是打开整个全球互联网的窗户,这扇窗无法正常开启,那就相当于整个互联网的信息获取形成极大阻碍,潜在代价难以估量,成为网络大国的最大软肋之一。
搜索引擎的商业模式是自己不生产内容,而是通过抓取全球范围的目标网站内容,进行分词、排序、索引等处理,很大程度上属于网络空间最重要的信息基础设施,因此除了一流的技术之外,更重要的是坚守公共性和社会性,秉承独立和公正,为用户提供最高效和最精准的搜索结果。集聚所有内容,为人民服务。搜索引擎是开放、共享、自由的互联网精神最佳体现。当今世界最大的两大搜索引擎,一个是谷歌,一个是百度。面对中国网民,都没有担当起响应的责任。可以毫不夸张地说,中国网民在搜索引擎方面面临的尴尬,可以最好地呈现中国的互联网精神缺失的程度。
毫无疑问,迄今最优秀的搜索引擎非谷歌莫属。但是,2010年因为创始人个人意志主导,谷歌不愿意接受中国制度管理,自己主动退出中国,放弃为全体中国网民服务。于是,英文内容的搜索,尤其是谷歌学术留下的空白,至今无法填补,对中国科研工作者和整个知识界造成的损害难以估量。过去5年,各个层面为谷歌重返中国做了大量努力,但是直到今天,谷歌也仅仅愿意将其与自己切身利益最大的安卓应用商店重返中国,而与网民切身利益最大的搜索业务,自己依然不愿意回归。自我利益而不是首先从用户需求出发,依然是谷歌决策的主要考量。
百度作为本土最成功的搜索引擎,三大互联网公司之一,商业化上可谓非常成功。百度2014年收入490.52亿元,年增53.6%,全年净利润131.87亿,年增长25.4%,净利率26.9%。但是,百度赖以成家的,迄今也是主要收入支柱的是广告和搜索内容混排的竞价排名,如今包括百度百科也以每条5000元四处兜售。过度商业化无疑损害了百度在获得网民更好的尊重。百度学术与谷歌学术的差距每一个用过的人都非常明白。百度多年前启动的国际化迄今没有任何突破,耗费巨资进入日本市场也全线回撤,英文搜索更是迄今没能迈出步伐。
谷歌不进来,百度出不去。但是,全球信息一体化的今天,网民获取信息和知识的需求不能闭关自守。我们必须正视客观现实:互联网上的信息和知识还是英文占据绝对主导,我们的学习和科研,依然严重依赖英文内容。如果与英文内容的世界隔绝,我们整个社会的科研、学习以及发展,都是不可想象的。要知道,从网民数量角度看,目前全球网民超过30亿,中国网民将近7亿,我们占据五分之一多,绝对是网民第一大国。而根据W3Techs最新统计的结果,全球网页内容根据语言排序,英语内容一家独大,占54.1%,而中文内容排在俄语(6.1%)、德语(5.7%)、日语(5.0%)、西班牙语(4.8%)、法语(4.1%)、葡萄牙语(2.6%)之后,只以2.1%的比例排在全球第8位。目前全球网民以英语为第一语言的用户占比分别为26%和22%,几乎旗鼓相当。但是,我们内容的全球占比和网民的全球占比相差十倍左右。而在2011年,中文内容占比还有5%。这个巨大的鸿沟标志着我们生产内容的瓶颈,以及网民获取全球内容的局限性,触目惊心。日前,国际电信联盟(ITU)发布《衡量信息社会报告(2015)》,全球ICT发展指数(IDI)数据显示,中国从2010年3.69第87位上升到2015年5.05第82位,略高于全球平均5.03。但是,其中最拖后腿的就是人均国际出口带宽,2015年排名138位,低于我国综合排名56位。这个数据最能体现我们国家与外部的信息获取和互动程度。
中国网民如何才能享受好的搜索引擎?只要知道了问题,对策总会有的。一方面,对于国内搜索引擎企业借助垄断的过度商业化,必须通过法律形成有效的制约,强化搜索引擎的公正性和中立性。确保整个社会获得的信息不被过度商业化而扭曲。比如,应该禁止整个行业竞价排名的内容混排,确保正常搜索结果和商业广告分离。禁止搜索引擎不公正地干预搜索结果,尤其是将搜索流量不公正地引流到自己的应用和自己投资的企业。禁止百科、贴吧等用户创造内容的社会性服务,进行有偿编辑的过度商业性开发。当然,更重要的就是要激活市场竞争。一方面,为搜索引擎营造一个阳光化、透明化的制度环境,积极争取谷歌搜索优先重返中国,拒绝谷歌只顾自己利益而避重就轻的选择性进入。谷歌进入的问题需要谷歌、政府部门等多方更具建设性的努力。
应该说,中国互联网发展到今天已经不缺钱,也有足够实力吸引全球第一流的人才。但是中国搜索引擎杀入主战场,进军英文搜索,重大的挑战肯定不少,其中主要是技术和成本。要知道,美国的互联网巨头无论是雅虎还是微软,挑战谷歌的垄断地位多年,也进展有限。没有重大的技术创新,撼动谷歌市场地位,实现弯道超车很难。另外就是投入产出问题,全球的服务器部署和市场拓展,需要的投入肯定是巨大的,而产出很难预测。所以,没有技术创新,没有远大理想,没有足够资源,这本身就是一个望而生畏、甚至望而却步的事情。
目前谷歌抓取的网页大约是30万亿,而百度抓取的网页将近1万亿,差距不至一个数量级。中国搜索引擎固守国内,不走出,永远只能处于边缘地位,与我们网络强国战略不相称。国家要有相应的战略、制度和政策鼓励更多的本土搜索引擎走出去。最后,必须汲取教训,避免过去缺乏市场竞争力而浪费资源的官办模式。中国搜索引擎需要与全球的信息形成真正的接轨,能够互联互通。这是中国网民的期待,也是中国产业发展的需要,也是经济发展的需要,更是中国社会发展的需要。