乐文小说网

手机浏览器扫描二维码访问

第9部分(第1页)

户一些安心,使他们对视线以外谷歌发生的事情少一些担忧。如果谷歌愿意更多地开放,它就能够证明在公司的日常运行中并没有人为的干预:谷歌的模式建立在自动化的调节上,在谷歌的信息工厂里从事工作的是软件,而不是人。

独步天下的谷歌算法(1)

任何人都可以召唤谷歌主页并动员起谷歌搜索引擎的全副力量,而不必为登录提供任何个人信息。###别、种族、年龄、受教育程度、职业——一切都不必公开。搜索引擎只搜索它所接收的词语,以及连同搜索请求一道传过来的不起作用的网络地址。

谷歌之所以拥有回应匿名提交搜索请求方面的技术,源自其创始者们致力于尽一切可能从网络站点而非用户方提取信息。所谓算法就是为解决具体问题而设立的一套规则:它是用于构建复杂的计算机软件的基础材料。谷歌的PageRank算法就是用于对网页的链接进行分析,辨别某一个页面同其他页面何者名气更大。谷歌的搜索引擎不需要了解用户的任何情况,而只需猜测当搜索语词被键入时用户的心里在想什么。

若能在匿名搜索领域成为一种核心力量,将对谷歌有着极大的帮助,而且这种帮助的方式还是谷歌在创办之初未曾预料到的。随着在线世界以指数次幂的规模持续扩大,在线收集的个人信息飞速增加,用户们已经不安地看到一个又一个公司或蓄意或无意地释放了一些被用户当作个人###的信息。###每泄露一次,人们的提防心就加重一次;于是用户们希望得到承诺,使他们的个人信息受到切实保护。令谷歌感到幸运的是,它的搜索服务不需要了解用户的身份就可以开始工作。

谷歌的搜索方法借重数学模型,不需要个人信息,因而它提供的广告是由搜索内容决定,而不是由人工提交的,这样就能保证广告服务对象的身份不致泄露。谷歌的这种方式使它在与Facebook等社交网站的经济效益竞争中处于有利位置,因为后者向广告商提供的是接近具体用户目标的机会,而谷歌出售给广告商的只是接触被用户视为个人敏感信息的机会。

谷歌优于其社交网络竞争对手的地方在于毋需了解其用户的个人信息就可以完成网络搜索,不过,这个优点却被它在除搜索以外的其他许多服务项目上的扩张行为抵消了;在这些服务——如它的电子邮件服务Gmail——中,谷歌所获取的资料是极其私人###的。谷歌知道,用户们也许会担心它的雇员可以随意偷看谷歌用户的电子邮件。这个问题不仅谷歌有,微软、雅虎以及美国在线的雇员也可以在用户私人的电子邮件中乱翻,而且这几家公司的服务器所处理的电子邮件信息比谷歌要多得多。所以被担心陌生人擅自阅读他们个人信息的电子邮件的用户单独挑出来,这对谷歌的确有点儿不公平。就谷歌而言,它为了让公众放心而采取的措施无论如何也不能完全令人信服。谷歌说,只有一小部分职员被允许接触由Gmail保存的电子邮件,因此它们不会泄露。但是,令人不太放心的是,公司还规定了一些特殊类别的用户,他们的电子邮件是放在谷歌的雇员禁止进入的地方,“无论他是公众人物,还是某个具体公司雇员,还是谁的熟人”。这能禁止电子邮件被陌生人当作消遣物来阅读吗?为维护这一规定而制定的惩罚措施——解雇——足够严厉吗?能有效杜绝这种行为吗?规定公布后,有违规行为被查处吗?如果某个用户的电子邮件被偷,他能得到通知吗?

正如谷歌所断言的,这类担心是没有事实根据的,对某些公司安全缺口的担忧使人们对所有保存用户个人资料的公司都产生了不信任感。尽管2007年的一篇文章报道了Facebook的雇员(而非谷歌雇员)偷看了用户的资料(据推测可能是为了检查可能的候选人的日期),有的人篡改了电子邮件信息,还有的人更换了用户的文件夹的照片,但谷歌的私密###保护措施也受到了越来越多的怀疑。

独步天下的谷歌算法(2)

在谷歌创办时,佩奇和布林还不必有###方面的担忧。他们一心一意地钻研如何让评定网页的过程自动化。他们的方法无疑优于雅虎依靠人工编辑来维持一个用人手挑选的网站指南引擎的运行。谷歌取代雅虎进而赢得领袖群伦地位的故事的启发###就在于,谷歌在计算机的应用方面比那些大公司更加灵巧。

谷歌依靠搜索引擎起步,它只能从事检索和分析网页的单调工作。2000年,公司与当时比自己大得多的雅虎公司达成了一项交易——为雅虎的用户进行网页搜索。这对谷歌的财务而言算不上一宗大买卖,也无助于树立起自己的品牌。雅虎的用户甚至不知道谷歌才是提供搜索结果的“批发商”,而是以为这些结果都是雅虎找到的。但是这笔交易使谷歌得到了某种比销路和品牌意识更具战略价值的东西:它为谷歌提供了大量的搜索查询的第一手资料,这是谷歌改进搜索技术急需的原始材料,有了这项内在的能力,就可能将数据量的增长转变为搜索结果质量的提高。

随着收集的信息越来越多,佩奇和布林的技术也变得越来越“聪明”,自然,俩人迟早会开始思考如何着手处理无所不包的原始数据。如何使用这些没有相互联系的具体信息,在当时还没有被当作最迫切的问题。先收集,后分析。如果这些信息还没有被数字化,那么谷歌就不计成本将其数字化。谷歌最早的网络经验体现在它比任何公司都更具有搜集更多信息的智慧上,它以多种方式让搜集信息的规模受人喜爱,产生交叉检索、相互参照的更加密集的集合,贡献出世界上复杂程度最高的搜索结果。

谷歌比它的主要竞争对象雅虎和微软更早就认识到,一个将所有信息全部网罗殆尽的系统,依靠人工是根本无法完成的。正如人类的思维要依靠协调发展的神经系统内的连接一样,数字化的信息搜集也要依靠以软件带动的相互对接,而不必介入人工。软件的算法固然是由人制定的,但最终产品的复杂程度远远超过了人类凭借手工所能达到的水平。

在公司建立的过程中,佩奇和布林运用了许多不同的算法。但在哲学定义上,这些不同的法则却不属于物质范畴:谷歌的所有算法都可以说属于总的算法的组成部分,所谓“算法”就是软件公式的简化形式,谷歌的创立者们以为它们是解决任何现存问题的最好手段。他们对算法的力量坚信不移,因而采取了一种颇引人争议的推论:由算法所导致的结果无需以人工介入的方式进行编辑、调整甚至触摸。对于处理世界上的所有信息的系统进行调节的唯一途径是将一切过程都自动化。算法也可以用手动的方式加以调整和改进,但是修补过程只能由算法在进行搜索之前自行完成。一旦他们允许对算法进行复评,并在搜索完成之后用搜索结果来修补,这种人工介入就会使系统变慢,使它步履蹒跚。在谷歌,实现规模至高无上,而这必须依靠完全自动化的过程。

在谷歌成立之初,算法的力量在搜索业界并未得到广泛的赞赏。在雅虎-谷歌结盟时期,谷歌似乎不想对任何人摆出竞争姿态。在它的早年,即上世纪末和本世纪初,谷歌还没有找到明确的发展方向,也无法使人相信自己是一家能够将全世界的信息都组织起来的公司。倒是雅虎牢固地树立了作为值得信赖的信息来源的形象,似乎完全有可能将自己的任务完成好。作为门户网站,雅虎是许多网络用户在线访问的第一个地方,而且公司提供了一目了然的服务和信息。这使它成为用户必须访问的最可靠的网站。它提供的内容包括电子邮件、分类广告、游戏、新闻、体育、天气、股票行情以及管理员认为能吸引访客进来并使他们留下来的一切信息。

独步天下的谷歌算法(3)

如果它的用户感到有必要搜索网络,雅虎就能充当一个被公认为最权威的向导,因为它是由网站编辑亲手编纂的,他们仔仔细细地做着去芜存菁的工作,为网站整理清单,将内容分门别类层层分级。但是公司的管理层却不将他们稳定而高质量的网站目录系统视为值得珍视的战略财富。公司的观点与当时流行的看法完全相同,认为网站索引只不过是公共门户网站的一个次要组成部分,三分之二的雅虎访客都是为了其他目的或寻求其他服务而来。

在雅虎,网络搜索可以分为两个互不相干的步骤,当然,其中隐藏着相当的复杂###。第一步,当搜索词语提交后,雅虎就对由它自己的编辑们编制的网站名录中的主题词表进行查找,如果搜索词与它索引表中的任一词语相匹配,那么相关的目录项就会显示出来。如果没有相匹配的结果出来,那么搜索就会进入第二个阶段,雅虎将这个词语送到与之订有契约的外部搜索引擎上,由后者在它所搜集和整理的所有网站上的网页的拷贝页中进行查找。这第二步几乎被业界的每一个人都视为无趣的幕后服务,这种服务从任何可互换的提供者那里都可以得到,他们之间并无明显的差异。一个个看上去都十分相似,所以雅虎也定期更换为它提供幕后服务的公司。

2000年,雅虎决定将分作两步的搜索过程合并,并将此项业务交给新的一揽子服务提供商——谷歌。在当时还很弱小的谷歌看来,能以成立刚刚两年的资格就得到雅虎交付的如此重大的使命,无疑很有成就感。谷歌搜索的质量相当之高,它已经在强手如云的领域里脱颖而出。根据2000年对于用户体验的一项研究,在13个搜索网站中,谷歌名列第一。此外,谷歌之所以能得到雅虎的合同,不是因为它的搜索结果比此前的Inktomi公司好,而是因为当时的谷歌正愁无米下锅,所以它开给雅虎的提供同样服务的价格是最低的。在Inktomi丢掉了雅虎的合同后,它的一名负责人嗤之以鼻道:“我们不会为了赢得生意而不计代价。”

雅虎之所以未把谷歌作为潜在的竞争对手,原因就在于谷歌不同于Inktomi,它披着一件“零售商”的外衣——它自己的网站,它可以向顾客提供更好的搜索结果,从而为自己吸引越来越多的访问者。在谷歌与雅虎签订提供搜索结果的合同两年以后,谷歌在美国搜索业务市场的份额就达到了雅虎的水平。与此同时,谷歌在全球范围内也跃居前列,到2002年4月,谷歌就承担起全世界范围内47%的搜索量,而雅虎的比例是21%。尽管如此,直到又两年之后的2004年,雅虎才意识到,它与谷歌的合作是个巨大的错误。于是,雅虎立即在自己的网站用自己的搜索引擎换下了谷歌的引擎。雅虎试图使人相信,它仍然控制着一个功能,它终于懂得,这个功能对它继续保持成功者的位置至关重要。然而此时,谷歌作为搜索中心的地位已经得到了巩固。

雅虎甚至从未近距离地追上谷歌。根据一项研究,2007年5月,谷歌在美国在线搜索所占的份额已经超过了50%,雅虎占26%,而微软只占10%。谷歌的份额持续扩大,到2008年1月,谷歌占有了58%,而雅虎则掉至22%。新闻网站的CEO里奇·斯克伦塔说出了一个相当具有说服力的事实:谷歌所占有的搜索份额远远高于上述市场分析的结论,甚至早在2006年底就已经超过了70%。2007年初,斯克伦塔承认,他的数据表明,谷歌的市场份额实际上是78%~80%,但他用四舍五入的方法把这个比例降到比较保守的70%,“以使之更加可信”。 电子书 分享网站

独步天下的谷歌算法(4)

2008年,当微软洽购雅虎时,公司的雇员们都发表了意见,认为两家的工程师能合并为一支队伍,将更有利于与谷歌展开竞争。但是谷歌的算法之所以在它还是一家小公司的时候就能得到较好的搜索结果,关键在于谷歌工程师队伍的质量,而不在于它的人员数量。

无论是微软还是雅虎,两家公司对于谷歌算法的威力的认识都过于迟缓。在谷歌浮现的早年,雅虎就受到依赖人工编程这个注定要倒霉的决定的拖累。1998年,在40人的雅虎索引维护团队中负责的斯里尼瓦桑(Srinija Srinivasan)说,她和她的新编辑们总是赶不上网站的增长速度,尽管他们已经开始对“无限的资源”进行了自行处理。从这个较早的时候开始,他们就已经不再勉为其难了——而是决定简单地满足于将自己选出的东西描述为“已有的东西当中最好的”。当然,凭什么他们肯定自己能从急剧膨胀的数据池里鉴别出最好的东西,这是一个难以回答的问题。

而就在此时,谷歌已经享受到了依靠不断更新的技术所带来的好处。算法塞进的数据越多,结果就越好。公司并不隐瞒算法所处理的网页到底有多少——2004年,他所公布的最后数字是对80亿个页面做了索引,此后它就决定不再提供更新数字了。但即使在2000年,观察家们就已经极力称赞谷歌的搜索结果与其他的引擎相比具有显著的优势。丹尼·苏里文在《搜索引擎报告》中写道:

当我对一群人说起搜索引擎并提到谷歌时,听众中有些人便会有不正常的反应。他们微笑、点头,就跟你在发现了一个别人不知道的秘密通道时也会有的那种表情一样。每次我说起这些事,都会看到有越来越多的人像这样微笑、点头,为发现了谷歌而惊喜。

谷歌研发了一种更加复杂的算法,它可以根据一个给定的搜索词语来选择哪类广告在它的搜索结果上出现,从此,它与竞争对手的距离就更加拉大了。谷歌采用拍卖机制,让赞助商竞标,从而确定他们愿意为每一个点击支付的最高金额。这种方式是谷歌的任何竞争者都可以仿效的。但谷歌还有一个令人意想不到的手段,保持它网站上的广告带来的利润远远超过其他任何网站发布的广告,即采用算法对赞助商在历史上的表现进行评估,看看他的广告对点击率的吸引力空间有多大,出价最高的竞标者不一定就能得到最好的广告位置,还要分析他历年的统计数据,看他是否最有可能为谷歌带来最高的回报,既要考虑到预期的点击数,又要考虑平均每一次点击创造的价值。谷歌受命履行的搜索越多,关于广告效益的历史数据收集得也就越多,它的评估体系就越精确。多亏谷歌公司拥有了同行业无人能够复制的算法,谷歌引擎的每一次搜索才能带来其他任何人都难以企及的收益。

微软一直囿于软件设计方面没有人能出其右,所以未能及时注意到谷歌软件的威力。要让人们承认像谷歌这样的相对缺乏经验的公司能够研发出比微软的产品更加复杂的软件,似乎不太容易。2004年,有一篇博客提到了谷歌的搜索结果比微软的好得多,这引起了一阵不安。在谷歌搜索栏中键入“微软博客”,就可以直接链接到微软雇员的博客。但同样的搜索词放在微软自己的MSN服务器中,却会导向西雅图一家日报的一名记者的博客,因为它凑巧包含了频繁提到“微软”字样的段落,并且拒绝搜索引擎的算法。这件事令人非常窘迫,因为将谷歌的搜索结果优于微软的事实公开出来的是微软雇员罗伯特·斯科博(Robert Scoble)在微软博客上写的一篇博文。书包 网 。 想看书来

独步天下的谷歌算法(5)

微软的管理层并未制止斯科博的言论,但谷歌誓在Web搜索中获得更多份额的雄心却受到了鞭策。微软的研发人员叛逃到谷歌的现?

恶女改造直播(快穿)  宣平郡主  人在女尊战国,目标:大秦帝太后  疯子、傻子、色情狂  [HP、暮光]坦言  我以为我只是玩了个游戏  偏偏  神女追梦记/梦中欢  全能佣兵  (综漫同人)病系男子图鉴  和福尔摩斯当邻居的倒霉日子[综名著]  西藏的天堂时光  所罗门的刺青  与幸福擦肩  黑心女配拿了好人剧本[快穿]  女A的品格[娱乐圈]  粉黛未央  57 废妾惹桃花 妖娆小桃  他在偷偷学习啦[穿书]  给高富帅当保镖  

热门小说推荐
异界之魂破苍穹

异界之魂破苍穹

九神血脉,八荒古葬莽莽苍天,灵动乾坤握掌生死,斗转轮回武之极致,魂破苍穹人道不合,横念纵生,乱象百出,乾坤混沌凝苍穹,聚魂灵,窃阴阳,转涅槃,破而后立,还乾坤朗朗众生芸芸...

九皇妃

九皇妃

一朝穿越,腹黑轻狂的佣兵首领,竟成了大商皇朝著名的花痴草包女!绝色姿容却不识点墨,钟情美男四皇子却被人丢进狼群!再次睁眼,却今非昔比,谁欺她辱她,她必双倍奉还。快意恩仇,人生潇洒。只不过,这个男人是谁啊,怎么比她还护短?那个短还是自己?情节虚构,请勿模仿...

暴莉萌花

暴莉萌花

这是个怎样的故事呢?小爱哎(这是一本小花成长日记!)雪莉这是一个发生在异界的人与自然的故事!某BOSS这是一个关于爱情和家族间如何取舍的故事众人这是一个女人和一群男人的故事!作者喵你们都错了!这其实就是一个暴力女和一株吃货花为解决吃饭问题而努力的故事。欢迎入坑,活埋中...

官路驰骋

官路驰骋

落魄的草根公务员陈步云无意之中救下了县长的女儿,并因杰出才能得到了县长的看重,从此开始了他波澜壮阔的一生  官路弯弯,步步惊险,身为草根,却能驰骋纵横。  是时乎?是命乎?  他没有背景没有关系没有钱财,但却有奇功有医术有运气,更有执着的信念与不屈的意志,还有那一颗为人民服务的心。  而人民是历史进步的动力,所以,你懂的!...

七界战仙

七界战仙

一万年前,仙路崩断,仙凡永隔。一万年后,一个拥有世界树幼苗的少年,从神武门一步步崛起,修炼太古魔体,肉身成圣,纵横风云,逆天战仙,举世无敌。小说关键词七界战仙无弹窗七界战仙txt全集下载七界战仙最新章节阅读...

侦破高手

侦破高手

葛藤一位警校毕业大学生,三年应聘未果,偶然一次机会当了私人侦探,结果让他走了侦探之路,不料一次侦查过程中得到了省公安厅领导的认可,破格聘为国家公务员,成为一位真正的警察,从此走上了刑侦之路。在侦查之路上,侦破一宗宗冤假错案,赢得了一个侦破高手的好名声!同时也一位热血青年,在与地痞流氓的斗争中,他不畏死亡威胁!他对待爱情,他从不欺骗女生感情,是个多情多义的多情种。...

每日热搜小说推荐