谷歌失败案例赏析:那些年在微服务上踩的坑

大家好,今天和在座的各位分享一些失败的经验教训。聊一聊这一类的话题要比那些成功案例更有意思。行业在进步,我们可以从过去的错误中吸取经验,并主动在未来的计划中避免,这一点很令人鼓舞。

背景信息

在开始之前,先介绍一下我在谷歌的经历。2003 年大学毕业后我直接加入了谷歌,在这之前我是一个音乐营地的营地顾问,营地顾问之前我在一家冰激凌店工作。我还记得在谷歌的第一天,第一个项目的技术负责人是 Andrew Fights,他现在是类似谷歌杰出的工程师的角色,我记得当时告诉他,我得去找人聊一聊因为实在不知道我在做什么,今天想起来还是很有趣的事情。在谷歌里我像海绵一样快速的吸收技术和其他的信息。今天我在这里谈论的一些事情其实要早于我在谷歌的时间,大约 2000 年和 2001 年左右。让我们从微服务,即谷歌的微服务版本开始讲起。

当时,谷歌的业务仍然押注在 GSA(谷歌搜索服务器)产品,其实最终 GSA 也并没有像想象中的那么顺利。当然了,其它事情也是这样,毕竟不能将一个虚拟的垄断产品与像广告这样数十亿美元的巨额业务相对比。不过,谷歌最开始是以搜索起家的,并专注在解决这一类的技术问题。

接下来要讨论的很多内容的原始驱动力来自于这张幻灯片。在经济危机之前,很多企业都将他们的基础设施构建在 Sun Microsystems 的硬件之上,并将 SolARis 作为操作系统。如果不考虑成本的话,这一套解决方案比现有的其它东西都要好,很多人买了很多这种 Sun box 也是基于这样的原因。但 Sun box 真的很贵,尤其是一个拥有庞大数据中心的企业,整个数据中心需要填满这种机箱以支撑业务的发展,成本就会影响到其业务渠道和活下去的底线。

谷歌当时就处在这样一个状况。当时的人会很自然的说:“Linux 虽然不够完美,不过功能也够用,它的硬件又很便宜,所以平衡下来我们可以选择 Linux 作为替代”。一定程度上,我也认同这些过往的事情是真实的,当时的人们成本意识很强,所以他们会不遗余力的去解决一系列 RAM、芯片等 Linux 出现的一切故障,以降低成本。而这就带来了一个结果 – 即 Linux 真的不可靠,特别是使用垃圾站硬件的时候,且问题很严重。我认为,谷歌从 Compaq DEC 并购中受益匪浅,这也是导致 90 年代一些真正令人难以置信的研究实验室死亡的原因。许多人比如 Jeff Dean 和 Sanjay Kumar 都来自那个世界,他们现在几乎都是质量工程师。当时的他们对如何在那些难以令人置信的不可靠硬件之上构建软件这个问题产生了强大的兴趣,后面发生的事情也是很多接下来要分享的内容。

然而在 2001 年并没有什么可以替代的方案,所以必须自己做。另一个问题是非常古怪的扩展要求。他们试图做一些当时非常大胆的事情,即索引每个网页的每个字。一些人将每个网页的每个单词收录并编入索引,其他人只是给它建立索引,然后丢弃那些限制竞争对手能力的原始数据。这是一项艰巨的任务,需要用到当时根本不存在的计算机软件。

因此,由于不可靠的 Linux 盒子,该软件必须横向扩展,并且必须在堆栈的任何组件中容纳频繁的例行故障。之前有一篇很棒的文章提出了“机器是牛而不是宠物”。我认为在这件事情上谷歌做对了。这些机器没有来自“星际迷航”的酷炫名字,它们只是 AB 1,2,5,7 类似的东西,那也是机器名。系统对它没有太多的依赖,它死了或者继续运行都不会影响其它部分。这个问题让人们开始思考如何建立更具弹性的系统。

以上是我如何描述事物的方式。在谷歌很多人都有博士学位。记得面试时,我还没有博士学位。而且,我只跟一个没有博士学位的人谈过,面试结束时,他说,“别担心,现在开始雇用没有博士学位的人了”,在那里有很多人比我更聪明,并且真的想将他们的知识应用到 CS 系统研究中,将这种类型的经验和知识应用于现实问题是一件很有趣的事情。

我认为构建微服务的唯一充分理由是组织结构,并且这也应该是大多数组织构建微服务的唯一原因。然而,这并不是谷歌构建微服务的原因。谷歌构建微服务是为了计算机科学,在这里,我不会去争辩从这个角度构建微服务其实也没有什么好处,当然肯定是有很多痛点驱动。

开始构建微服务之后,如果简单的认为它一定会很顺利,也没有事先调研所有可能的失败情况,那么一定不会顺利,而且实际上也可能会带来很多令人遗憾的结果。我和很多企业讨论过这个问题,这些企业也因为迁移的过程实在太痛苦了而放弃了向微服务的迁移。所以,一定要事先了解构建微服务的动因。就像谷歌里有很多人效仿大型的基础设施项目一样,有时我认为他们在构建一些并不必须的架构。理智的投资方式应该是遵循以下原则:“如果你不需要就不要去做,否则只会会让事情变得更困难”。

这样做的主要原因是最大限度地减少团队之间的人员沟通成本,一个超过 10 个或 12 个人的团队无法在一个工程项目上成功协作,它与人员沟通结构和工作授权有很大关系。因此,将项目团队映射到微服务可以减少人与人之间的沟通开销,从而提高开发速度。这是一个选择微服务的合理原因,但这也并不是我们在谷歌构建微服务的原因。

我认为可观察性包括两件事,一个是检测关键信号,即 SLI 的部分,它需要非常精确;另一个则是改进搜索空间。每增加一个微服务,可能发生的故障模式的数量随着服务数量的增长而几何式增长。我并不认为机器学习或 AI 可以神奇地解决这个问题。我们需要尽快发现可以帮助减少人脑假设的方法,只有在使用巨型仪表板之外的技术时才能实现引导过程。巨型仪表板在单体环境中运行良好,但我看到人们采用这种理念并围绕它构建微服务的可观察性。我认为有必要使用仪表板,但肯定不够。我采访过的 SRE 小组当时正在构建巨大的仪表板,我们的效率明显低于让它设计上更紧凑的团队,之后再使用其他工具来改进搜索空间。所以,不要混淆搜索空间的可视化和对它的精炼优化。整个搜索空间太大了且无法可视化,而且人类迄今也无法处理那么多信息。

在 LightStep,我们看到很多客户一直在努力解决这类问题。我不知道在座的各位是否经历过同样的情况,但我认为这是一种失败模式,谷歌肯定也明白这一点。曾经有一个大型的 Google 服务,大概名字是家庭类型之类的服务,它不得不使用代码生成器生成告警配置,最终导致了 35,000 行还要长的代码。我不记得其中的所有原因。但随后他们不得不开始手动维护这 35,000 行代码,然而这些配置是在 Google 内部完全模糊的 DSL 中编写的,手动维护所带来的痛苦程度无法比拟,这就是因为他们混淆了对 SLI 的告警信息和可能是根本原因的告警信息。监控不应该对根本原因发出告警,它应该是细化过程的一部分;而应该对 SLI 发出告警,对于任何特定系统,SLI 的信息不会有那么多而导致无法处理。

文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:天府财经网

(2)
上一篇 2019-07-02
下一篇 2019-07-02

相关推荐

  • 美法院称SHEIN公然撒谎,22个跨境商家组团维权获初步胜利

    3月5日,22个跨境商家组团应诉SHEIN的美国官司有了新进展。据美国伊利诺伊州地方法院公布的文件显示,法院支持商家反驳SHEIN临时禁令(TRO)的初步申请,并调整了商家账户的冻结金额,多个商家的冻结金额降至0美元、10美元,获得了组团诉讼的初步胜利。 在一个名为“赃物熊(Swag Bear)”的服装设计中,SHEIN利用版权漏洞发起的虚假投诉被美法院无情戳破。法院指出,事实毫无疑问地证实了,SHEIN新加坡总部公司明知道其不拥有“赃物熊”的版权,仍然两次向版权局谎称其拥有版权,并发起虚假的注册信息,这让美国版权局产生了错误的判断。 去年12月,SHEIN向美国伊利诺伊州地方法院申请,对Temu平台的29个中小商家发布临时禁令,导致中小商家集体遭遇资金冻结,裁员破产等损失。 一位卖家律师指出,这家总部位于新加坡的公司一直“利用TRO作为反竞争计划的工具,迫使商家通过SHEIN而不是其竞争对手供应商品。 据法院文件显示,一家名为“广州德贤服饰”的卖家律师称,该公司销售的被指控产品的利润不到1500美元,但SHEIN向其提出了40万美元的和解要求,如果商家同意停止在TEMU平台上销售,并在SHEIN独家销售,则可以进一步协商解决。 此外,一家拥有500 名员工的商家在遭遇禁令后裁员了300多人,另一个商家的1000名工人都在面临失业,还有商家只能依靠个人信用卡来支付工人的工资。 为了维护自身权益,22名商家组团聘请海外律师,对SHEIN的临时禁令发起反驳。经过两个多月的诉讼,法院发布的最新裁决支持了中小商家的权益,并大幅调整了商家被冻结资金的金额,一家名为“广州慧听网电子商务”的公司被冻结资金降至0美元,成功获得解冻,多个商家的被冻结资金降至100美元以下,SHEIN利用法律漏洞过度冻结商家账户的行径遭遇有效打击。 值得关注的是,法院文件还显示,SHEIN正在将广州公司的版权…

    2024-03-11
    2.2K
  • 英法院最新裁决:驳回SHEIN虚假投诉,终止中小商家临时禁令

    2月17日,SHEIN与Temu两家跨境电商平台的诉讼又有新进展。据一位法律界的博主爆料,英国高等法院向双方律师发布了一条新裁决,Temu反驳SHEIN关于使用商家图片投诉的申请悉数有效,法院全部予以批准,此前的临时限制令也从法令发布之日起予以终止,遭遇此类投诉的商家更无需下架相关产品。 英法院驳回SHEIN对Temu商家的虚假投诉 去年8月,SHEIN在伦敦对Temu提起诉讼,声称Temu商家的产品图片涉嫌侵权,并向法院申请临时限制令,要求Temu商家下架相关产品。同年9月,法院按照惯例向TEMU商家发布了临时限制令。 为了维护平台中小商家的权益,Temu积极应诉,并对SHEIN的版权投诉发起反驳。经过双方举证,法院驳回了SHEIN此前使用商家图片进行举证的投诉,认定SHEIN未能有效证明其拥有商家的图片版权,Temu对SHEIN侵权投诉的反驳全部有效。 在判决理由中,英国高等法院的法官表示,花了这么多时间和律师费,SHEIN对于Temu提出质疑的图片,竟然没能提供一张完整的版权证明,令人非常吃惊。 英法院对SHEIN未能出示一张完整版权证明表示吃惊 据法院文件显示,SHEIN为了证明其拥有商家的图片版权,在举证中出示了商家入驻平台时签署的“独家经营协议”,但遭到了英国高等法院的否决。法院认为,因为商家会同时在多个平台进行销售,仅依赖商家协议中的承诺条款并不足以证明SHEIN享有版权的所有权。 此外,法院还对SHEIN如何证明其拥有的商家版权进行了重新界定。法院要求,针对商家拍摄的图片,SHEIN在投诉时必须提交摄影师信息、第一版权所有人证明以及完整的权利转移链条。如果不能提供完整的证明,Temu及商家则不需要再理会SHEIN的投诉。 这对于中小跨境商家来说,无疑是一个令人振奋的好消息。一直以来,跨境商家深受知产霸权及恶意侵权投诉之苦。去年12月,Temu在美再次起诉SH…

    2024-02-20
    799
  • 大吉大利过年吃鸡 成都禽类收货量环比上涨536.06%

    随着春节的日益临近,巴蜀大地到处弥漫着浓浓年味。年货市场更是进入产销旺季,今年四川的年货保供情况如何?与往年相比,又涌现出哪些特色年货?数字货运平台运满满以四川省和成都市的年货运输数据为例,给出了一组答案。 运满满货运大数据显示,今年1月以来,四川省的公路货运量出现上涨。从具体货类来看,麻将机、鲜花、水果的公路发货量均位居全国前列。其中,麻将机发货量排名全国首位。 搓麻将已经成为全国人民春节期间的娱乐项目之一,近几年更是受到了年轻人的喜爱。“独乐乐不如众乐乐”,数据可见,作为最爱搓麻的省份之一,四川人民在分享麻将所带来的快乐这件事情上果然毫不吝啬。 除了娱乐,年货清单上最重要的类别就是食品消费了。《数字物流产业带》报告显示,四川省五大产业带中有三个均与食品相关,分别是凉山西昌的浆果,成都郫都的调料佐料,和攀枝花米易的茄果。 今年成都人最爱置办的年货是什么?答案还是食品。运满满货运大数据显示,2024年1月以来,成都市收货量最大的年货品类Top5为糖、水果、玩具、服装、坚果。与上月同期对比,涨幅最大的年货Top5分别是禽类、鲜活水产品、水果、玩具和鲜花。其中,禽类环比涨幅高达536.06%。 具体来看,成都的禽类主要来自巴中、渭南、白银、宿迁、宿州,鲜活水产品主要来自南京、上饶、江门、汉中、自贡,水果主要来自桂林、 眉山、河池、南宁、赣州。从运输线路的分布可以看出,在今年涨幅较大的年货品类里,四川本省的公路运输十分频繁,年货消费热,带动了省内的供需两旺。 据运满满数据显示,1月以来,成都市发货量最大的货类也是食品饮料,“食在中国,味在四川”,舌尖上的巴蜀果然名不虚传。特别是冬季,从12月中旬起,四川特色水果耙耙柑开始成熟,眉山、蒲江等地种植的耙耙柑进入采摘季,一箱箱果香四溢的耙耙柑通过公路货运,流向全国各地。运满满货运大数据显示,1月以来,成都市发货量最大的货物排名里,水果位…

    2024-02-05
    972
  • 大专毕业后,他选择了干货运,“不努力连媳妇都娶不到”

    “3年入行5年懂行10年成王”。91年的货车司机左师傅一直信奉这句话,在他看来,勤能补拙。不管干哪行,只要踏实肯干,勤学好问,有向上的思想,总能做出成绩来。 “弃医从运” 出生于云南昭通的左师傅,家境并不富裕。在他的印象中,同龄人中甚至还有文盲。大专毕业的他学的是中医,左师傅坦言,“班里三十多名同学毕业后基本都选择了转行,当医生太压抑。”2015年,左师傅开始开面包车跑58速运,算是正式接触货运行业,可每天几十块的收入连养活自己都难。于是再次转行去干工地。“2017年,无意间接触到了专线物流,我就开始跟公司合作做卸货、分流。”也是在这期间,他接触到了货运平台,知道了运满满。 2020年,左师傅买了一辆4米2的厢货,虽然没有熟人没有资源,但平台上的单子很多,加上疫情等因素,刚开始运价还不错,每个月轻轻松松就能赚到一万。拉了一年整车货之后,行情下滑,左师傅立马开始研究零担拼车。2023年,他换了一辆6米8的高栏。他觉得换车是必然之举。“因为我还想在这行走的更长久一点,6米8的车能让我对货物有更多的选择。” 熟能生巧 左师傅现在月收入至少2万,从最初开小面包月收入两三千,到现在的2万+。他在运输线路、沟通技巧、客户维系、服务等方方面面总结了一套心得。 一、建议刚入行的先跑固定线路。左师傅的运输线路基本固定,主要是佛山到云贵川。80%的货也是固定好的,佛山出来拉瓷砖家具,工地建材门窗,回广东拉水果蔬菜。在他看来,固定线路对司机至关重要,哪个季节有什么货,什么价格,哪条路好走,成本要多少。特别是云贵川一带,路况险峻复杂,对于熟悉这边线路的司机,货主会更放心把货交给你。换句话说,你如果对这条线路足够熟悉,手里也就有了更多谈价的筹码。“之前我刚跑这个线路的时候,会自己拿个笔记本记录,问同行问老板,算运费算成本。现在跑的多了,费用啊货源啊,早就记在脑子里了。” 二、服务好客户最终受益的是自…

    2024-01-29
    1.9K
  • 比视觉中国狠20倍!北京统合信达1张图索要1万,穿越式维权第一案

    自从视觉中国(000681.SZ)打开勒索式维权的潘多拉魔盒后,大大小小的版权公司牛鬼蛇神不断跳将出来。 近日,我们又被告图片侵权了。这不是第一次,却是最离谱的一次。原告北京统合信达文化传播有限公司(法定代表人:邢玉冰)胃口之贪婪、吃相之难看令人叹为观止。 权属证据不足 逮着一只羊往死里薅 根据诉讼材料,本号所谓图片侵权发生在2017年6月18日,而这家北京统合信达文化传播公司2023年6月12日才成立,它对标的图片拥有著作权的权属证据,也仅仅是一张“1TU壹图”网站的截图,如何证明原告拥有该图片著作权?如果原告是该图片原作者或知识产权继承人,为何不在证据材料里提供? 另外想问,是我们穿越到未来“未经原告许可”窃取了你们的图片、P掉版权水印、并对图片大幅修改,再穿越回到2017年发布文章?还是你们穿回6年以前,把图片发布到网上等我们上钩? 进一步查询发现,这张原告所谓的版权图,在百度上有200多张相似图片,且早在2015年就有不止一家网站使用了。 再从原告所谓版权图片上的多国货币元素(未发现人民币),以及从大量英文内容来看,我们很怀疑,原告是不是把外网免费图片据为己有,虚构权属证据?律师表示,原告方如果以虚构的版权索赔,可能涉嫌诈骗罪或者合同诈骗罪。 除了脑洞大开的维权逻辑,北京统合信达文化传播公司的索赔金额也是令人大开眼界。1张图索赔1万,是其线上授权正常售价的222.22倍,新年开门红,你们这是逮住一只羊往死里薅啊! 这恐怕让贵圈的祖师爷视觉中国也自叹不如。2023年8月15日,知名摄影师戴建峰吐槽自己拍的照片被视觉中国告侵权,173张照片被索赔8万,合462元/张。 壹图网扮演什么角色?曾被曝以诉代销“前科” 而前述原告用以证明权属的截图网站“1TU壹图”,主体公司成立时间、ICP备案审核时间、增值电信业务许可证取得时间分别为2018年、2020年和2022年,均在本…

    2024-01-05 TMT
    6.9K
已有 0 条评论