谷歌4,小米2S和谷歌4到底哪个好啊?( 九 )


在谷歌,杰夫的知名度要高得多 。但是,了解这两个人的人知道,桑杰是一个与杰夫一样杰出的人才 。“杰夫非常擅长提出新的想法 。”与他们共事很久的同事威尔逊-谢(Wilson Hsieh)说,“而桑杰打造的东西往往经久耐用 。”在生活中,杰夫更外向,桑杰更内向 。在编写代码的时候,情况正好相反 。杰夫编写的代码令人眼花缭乱——他可以很快地勾勒出令人震惊的想法,但是他却完全没有理会阅读这些代码的人的感受 。桑杰的代码则让人很好读懂 。
为谷歌带来最大升级
在2003年的四个月中,杰夫和桑杰给谷歌带来了最大的一次升级 。他们用一个叫MapReduce的软件做到了这一点 。当他们第三次重新编写谷歌爬虫和索引代码时,他们想到了创建这个软件 。
次年,杰夫和桑杰又用MapReduce重写了谷歌爬虫和索引 。很快,其他工程师也意识到这个软件有多么强大 。于是,这些工程师们开始使用MapReduce来处理视频和其他任务 。
谷歌表面上是一个搜索引擎,实际上是一个人工智能公司 。当一些有进取心的程序员使用MapReduce软件来研究分析谷歌的数据时,他们让多种新的功能变成了现实:将用户的语音邮件变成文字,回答他们的提问,自动完成他们的搜索请求,并在100多种语言之间进行翻译 。这些功能是使用相对简单的机器学习算法开发出来的 。
杰夫说:“当你有大量数据的时候,简单的技术往往更有效 。”随着谷歌工程师越来越多地使用BigTable和MapReduce以及后来的升级软件来存储和处理数据,谷歌遍布全球的基础架构变得更加灵活,衔接更加顺畅 。像“云计算”和“大数据”这样的概念早在谷歌兴起之前就已经存在了 。
但是,杰夫和桑杰让谷歌对这些技术的运用达到了一个全新的水平 。用户们可能已经感觉到了某些变化:谷歌的云服务变得越来越聪明了 。
在2004年,由于杰夫和桑杰认为MapReduce可能对天文学家、遗传学家和其他有大量数据要处理的科学家有用,因此他们撰写了一篇论文《MapReduce:简化对庞大数据的处理过程》,并公开发表 。这篇论文产生了很大的轰动,给了人们很大的启发 。
工程师迈克-卡法雷拉(Mike Cafarella)和道格-卡特(DougCutting)深信MapReduce的重要性,于是决定从头开始免费克隆该系统 。他们最终将他们的项目命名为Hadoop 。随着Hadoop的成熟,它被财富50强企业中的一半企业采用 。它甚至成了“大数据”的同义词 。
后来的社交网络Facebook、职业社交网站LinkedIn和在线电影租赁服务Netflix均采用了Hadoop MapReduce技术 。美国*****前技术总监兰迪-加勒特(Randy Garrett)还曾向*****局长基思-亚历山大(KeithAlexander)演示过这项技术 。Hadoop执行分析任务的速度比以前的系统快1.8万倍 。它成为了一种新的情报收集方法的基石 。
“杰夫证明了这是可行的”
杰夫的性格中总有一种不安于现状的东西 。2011年,随着世界拥抱云服务,他开始与斯坦福大学计算机科学教授吴恩达(Andrew Ng)合作——他领导着谷歌的一个秘密项目,研究虚拟神经网络,即由虚拟“神经元”组成的软件程序 。
杰夫在大学期间接触过神经网络;那时,神经网络还不能解决现实世界中的问题 。吴恩达告诉杰夫这种情况正在改变 。吴恩达认为,有了谷歌的规模,神经网络不仅会变得有用,而且会变得非常强大 。
“我真不敢相信我竟然白白吃了这么多沙拉 。”杰夫感叹地说 。由于杰夫的神经网络知识从大学毕业后就没有多大进步,因此他开始恶补相关知识 。他的妻子海蒂看着他们的浴室里塞满了书 。杰夫开始一周花一天的时间在这个项目上,这个项目被称为“谷歌大脑”(Google Brain) 。

推荐阅读