谷歌失败案例赏析:那些年在微服务上踩的坑

大家好,今天和在座的各位分享一些失败的经验教训。聊一聊这一类的话题要比那些成功案例更有意思。行业在进步,我们可以从过去的错误中吸取经验,并主动在未来的计划中避免,这一点很令人鼓舞。

背景信息

在开始之前,先介绍一下我在谷歌的经历。2003 年大学毕业后我直接加入了谷歌,在这之前我是一个音乐营地的营地顾问,营地顾问之前我在一家冰激凌店工作。我还记得在谷歌的第一天,第一个项目的技术负责人是 Andrew Fights,他现在是类似谷歌杰出的工程师的角色,我记得当时告诉他,我得去找人聊一聊因为实在不知道我在做什么,今天想起来还是很有趣的事情。在谷歌里我像海绵一样快速的吸收技术和其他的信息。今天我在这里谈论的一些事情其实要早于我在谷歌的时间,大约 2000 年和 2001 年左右。让我们从微服务,即谷歌的微服务版本开始讲起。

当时,谷歌的业务仍然押注在 GSA(谷歌搜索服务器)产品,其实最终 GSA 也并没有像想象中的那么顺利。当然了,其它事情也是这样,毕竟不能将一个虚拟的垄断产品与像广告这样数十亿美元的巨额业务相对比。不过,谷歌最开始是以搜索起家的,并专注在解决这一类的技术问题。

接下来要讨论的很多内容的原始驱动力来自于这张幻灯片。在经济危机之前,很多企业都将他们的基础设施构建在 Sun Microsystems 的硬件之上,并将 SolARis 作为操作系统。如果不考虑成本的话,这一套解决方案比现有的其它东西都要好,很多人买了很多这种 Sun box 也是基于这样的原因。但 Sun box 真的很贵,尤其是一个拥有庞大数据中心的企业,整个数据中心需要填满这种机箱以支撑业务的发展,成本就会影响到其业务渠道和活下去的底线。

谷歌当时就处在这样一个状况。当时的人会很自然的说:“Linux 虽然不够完美,不过功能也够用,它的硬件又很便宜,所以平衡下来我们可以选择 Linux 作为替代”。一定程度上,我也认同这些过往的事情是真实的,当时的人们成本意识很强,所以他们会不遗余力的去解决一系列 RAM、芯片等 Linux 出现的一切故障,以降低成本。而这就带来了一个结果 – 即 Linux 真的不可靠,特别是使用垃圾站硬件的时候,且问题很严重。我认为,谷歌从 Compaq DEC 并购中受益匪浅,这也是导致 90 年代一些真正令人难以置信的研究实验室死亡的原因。许多人比如 Jeff Dean 和 Sanjay Kumar 都来自那个世界,他们现在几乎都是质量工程师。当时的他们对如何在那些难以令人置信的不可靠硬件之上构建软件这个问题产生了强大的兴趣,后面发生的事情也是很多接下来要分享的内容。

然而在 2001 年并没有什么可以替代的方案,所以必须自己做。另一个问题是非常古怪的扩展要求。他们试图做一些当时非常大胆的事情,即索引每个网页的每个字。一些人将每个网页的每个单词收录并编入索引,其他人只是给它建立索引,然后丢弃那些限制竞争对手能力的原始数据。这是一项艰巨的任务,需要用到当时根本不存在的计算机软件。

因此,由于不可靠的 Linux 盒子,该软件必须横向扩展,并且必须在堆栈的任何组件中容纳频繁的例行故障。之前有一篇很棒的文章提出了“机器是牛而不是宠物”。我认为在这件事情上谷歌做对了。这些机器没有来自“星际迷航”的酷炫名字,它们只是 AB 1,2,5,7 类似的东西,那也是机器名。系统对它没有太多的依赖,它死了或者继续运行都不会影响其它部分。这个问题让人们开始思考如何建立更具弹性的系统。

以上是我如何描述事物的方式。在谷歌很多人都有博士学位。记得面试时,我还没有博士学位。而且,我只跟一个没有博士学位的人谈过,面试结束时,他说,“别担心,现在开始雇用没有博士学位的人了”,在那里有很多人比我更聪明,并且真的想将他们的知识应用到 CS 系统研究中,将这种类型的经验和知识应用于现实问题是一件很有趣的事情。

我认为构建微服务的唯一充分理由是组织结构,并且这也应该是大多数组织构建微服务的唯一原因。然而,这并不是谷歌构建微服务的原因。谷歌构建微服务是为了计算机科学,在这里,我不会去争辩从这个角度构建微服务其实也没有什么好处,当然肯定是有很多痛点驱动。

开始构建微服务之后,如果简单的认为它一定会很顺利,也没有事先调研所有可能的失败情况,那么一定不会顺利,而且实际上也可能会带来很多令人遗憾的结果。我和很多企业讨论过这个问题,这些企业也因为迁移的过程实在太痛苦了而放弃了向微服务的迁移。所以,一定要事先了解构建微服务的动因。就像谷歌里有很多人效仿大型的基础设施项目一样,有时我认为他们在构建一些并不必须的架构。理智的投资方式应该是遵循以下原则:“如果你不需要就不要去做,否则只会会让事情变得更困难”。

这样做的主要原因是最大限度地减少团队之间的人员沟通成本,一个超过 10 个或 12 个人的团队无法在一个工程项目上成功协作,它与人员沟通结构和工作授权有很大关系。因此,将项目团队映射到微服务可以减少人与人之间的沟通开销,从而提高开发速度。这是一个选择微服务的合理原因,但这也并不是我们在谷歌构建微服务的原因。

我认为可观察性包括两件事,一个是检测关键信号,即 SLI 的部分,它需要非常精确;另一个则是改进搜索空间。每增加一个微服务,可能发生的故障模式的数量随着服务数量的增长而几何式增长。我并不认为机器学习或 AI 可以神奇地解决这个问题。我们需要尽快发现可以帮助减少人脑假设的方法,只有在使用巨型仪表板之外的技术时才能实现引导过程。巨型仪表板在单体环境中运行良好,但我看到人们采用这种理念并围绕它构建微服务的可观察性。我认为有必要使用仪表板,但肯定不够。我采访过的 SRE 小组当时正在构建巨大的仪表板,我们的效率明显低于让它设计上更紧凑的团队,之后再使用其他工具来改进搜索空间。所以,不要混淆搜索空间的可视化和对它的精炼优化。整个搜索空间太大了且无法可视化,而且人类迄今也无法处理那么多信息。

在 LightStep,我们看到很多客户一直在努力解决这类问题。我不知道在座的各位是否经历过同样的情况,但我认为这是一种失败模式,谷歌肯定也明白这一点。曾经有一个大型的 Google 服务,大概名字是家庭类型之类的服务,它不得不使用代码生成器生成告警配置,最终导致了 35,000 行还要长的代码。我不记得其中的所有原因。但随后他们不得不开始手动维护这 35,000 行代码,然而这些配置是在 Google 内部完全模糊的 DSL 中编写的,手动维护所带来的痛苦程度无法比拟,这就是因为他们混淆了对 SLI 的告警信息和可能是根本原因的告警信息。监控不应该对根本原因发出告警,它应该是细化过程的一部分;而应该对 SLI 发出告警,对于任何特定系统,SLI 的信息不会有那么多而导致无法处理。

文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:天府财经网

(2)
上一篇 2019-07-02 15:22
下一篇 2019-07-02 16:11

相关推荐

  • 尝美食、赏美景、玩非遗,在万里长江第一城,抖音生活服务陪你解锁春晚中国年

    引言: 大街小巷挂起大红灯笼,家家户户早早贴好了福字,全国人民必备的过年仪式——春晚也在倒计时中。有没有想过,电视里万人同庆的中国年,若能置身其中,会有怎样的感受? 今年,春晚分会场官宣落地宜宾。这座“万里长江第一城”,年味直接翻番——三江口夜空,五千架无人机点亮新年祝福;合江门的灯笼天幕流光溢彩;李庄古镇早早备下游园会、灯光秀,从早到晚快乐不打烊。 为了让这份热闹不只停留在春晚直播中,抖音生活服务联动央视总台春晚分会场宜宾,落地「跟着春晚游宜宾」活动,联动「抖音新春吃喝玩乐节」「发现宝藏小城」「来南方过年」三大IP,想把天南地北的你们请进来,打卡春晚同款取景地、品尝春晚同款宜宾味、体验春晚同款非遗年。希望你们能在宜宾的宝藏年味中,去触摸、体验最鲜活的中国年,开启马年的全年好运。 央视严选,在川南打卡春晚同款中国年 长江起点合江门、曾被列为“中国历史文化名镇”的李庄古镇、飘着百年酒香的501白酒文化胜地……央视总台春晚严选的实力毋庸置疑,而「跟着春晚游宜宾」,就能轻松把屏幕那端的年味,装进自己的新春旅程。 站在“万里长江第一城”的地标合江门,脚下是三江汇流,眼前是整座城市为新年亮起的绚丽霓虹,随手一拍,便是朋友圈里绝佳的开年素材。 走进在长江边坐落千年的李庄古镇,静下心来体味川南水乡的古朴静谧。若是遇到李庄白肉的小馆子,不妨一试,这便是最正宗的古镇年味。辞旧迎新,少不了举杯共祝,在501白酒文化胜地打卡从明清传承至今的古酒坊,敬绵延不绝的文化传承,也敬新年崭新的开始。 这一次,不必花大把时间做攻略,人气明星和达人已经整装待发,作为「宝藏宜宾推荐官」,手把手带你解锁,如草龙等即将登上春晚舞台的同款非遗,以及其它宝藏好去处。想来一碗麻辣鲜香的宜宾燃面?亦或是爽吃一顿热气腾腾的土火锅?数十位百万粉丝达⼈将为你提前踩点,交出一份闭眼冲也不会出错的美食路线。 众多优质商家也将上架优惠…

    2026-02-14 TMT
    2.1K
  • 春节政企采购不断档,京东公布五大举措保供稳价

    2026马年春节如期而至,恰逢9天春节长假与年货节消费高峰叠加,政企采购保障、民生物资供应迎来关键考验。为积极响应国家关于春节保供稳价、强化产业链供应链韧性、推进阳光高效采购的政策要求,京东政企业务充分发挥核心平台优势,启动2026年“京东春节送到家,政企服务不停歇”保供专项。 这一保供专项包含全国性物流履约保障、全场景服务在线、数字化采购工具支撑、一体化合规流程、多层次客户覆盖5大举措,全力保障春节期间政企客户采购不断档、供应不缺位、服务不打折,为千行百业春节期间的平稳运行贡献京东力量。 全国智慧物流网络广覆盖,夯实春节保供履约底盘 物流畅通是供应链稳定的生命线。京东政企业务依托京东物流连续第十四年“春节也送货”的成熟运营体系,实现全国超360个城市、超2200个区县、全球多地消费者即使是在除夕、大年初一,也可以正常下单收货,构建起一张纵深广阔、响应敏捷的节日物流保障网络。 为将这张网络的效能落到实处,京东政企业务面向客户做出坚实承诺:京仓京配订单,春节期间服务持续在线。在组织层面,供应链、物流、客服等多部门联合成立“春节联合保障组”,实现7×24小时专项全程值守。结合前置收集客户采购预测、联动物流进行精准资源储备的预案,确保了自营订单,尤其是涉及民生保障、应急响应、重大项目所需的物资,能够在春节期间有序流转。即使在除夕至初三等特殊时段,核心城市仍能提供“当日达”或“次日达”的高标准服务,以确定性的履约能力和精细化的运营保障,有力支撑政企客户在节日关键节点的运营连续性。 全场景服务“全程在线”,确保客户采购春节不断档 节日期间,服务不止步。京东政企业务结合企业客户在春节期间发放员工福利、采购应急物资、保障项目运转的迫切需求,在京东企业购推出“管家+商品+物流”三位一体的在线服务保障体系。 专属企业采购管家团队全程值守,提供从选品咨询、方案定制到订单跟踪的全流程对…

    2026-02-14
    2.2K
  • 京东健康联合四川德阳发放健康消费券 单笔最高减500元助力春节健康礼

    过年回家送什么?全国可领的健康消费券来了!京东健康携手四川德阳为您备好“孝心年货”清单。

    2026-02-10
    1.6K
  • 带货女王蛋蛋又添女性创业者新身份 央视探访蛋蛋“双11”直播间

    2025年“双11”落下帷幕,快手主播蛋蛋交出了自己独立创业后的首份成绩单:“双11”大促直播总成交额55亿元。11月13日19时30分,CCTV2《消费主张》特别报道《“双11”十七年创造中国消费新场景:流量密码》播出,央视记者走进蛋蛋“双11”直播间,探寻55亿元背后的故事。 今年28岁的蛋蛋(本名杨润心)是快手头部主播,也是全网首个粉丝破亿的女主播。从2019年开启直播至2025年6月18日,蛋蛋累计直播502场,创下了商品交易总额960亿元的成绩。 跟随央视镜头,人们去到蛋蛋11月11日“双11”收官之战的直播现场,看到了她在开播前进行的各项准备与直播工作的种种不易。 成绩体现了消费者对蛋蛋的信任,在这些准备工作中也展现了蛋蛋为获取、延续这份信任所作努力。要付出真心和把握细节,用“笨功夫”换“真信任”。蛋蛋认为,选品是信任的“第一道防线”。“对粉丝要有责任心。我一直在做的,就是为他们当好‘过滤器’和‘放大镜’,只让好的东西被看见。”她表示,团队的选品“第一条铁律”就是:如果我不愿意把它推荐给我最好的家人,它就绝不会出现在我的直播间。 在蛋蛋的“双11”直播中,雪花秀、天气丹、北京同仁堂、骆驼、海信、联想、立白等多个知名品牌产品轮番登场,覆盖美妆护肤、日用百货、数码家电、食品饮料等全品类。众多大牌的支持也体现了品牌方对蛋蛋的信任。 蛋蛋本次大促交出了55亿元的亮眼成绩单,一方面宣告了带货女王蛋蛋的强势回归,另一方面也标志着她成功迈出个人职业生涯从带货女主播到女性创业者的转型第一步。蛋蛋表示,“我们卖的不只是产品,而是一种解决方案和生活方式。” 据了解,10月中旬,蛋蛋出席了快手线下选品会。10月26日,蛋蛋正式回归直播间,开启“双11”首场直播即实现30亿元销售额,其中非黄金类商品销售额超20亿元。而这场首播的筹备时间仅10天。随后,“双11”大促期间蛋蛋多次开播,十…

    2025-11-14
    4.7K
  • 英雄联盟总决赛点燃蓉城消费 抖音生活服务助力“电竞+文旅”融合升级

    11月9日,2025英雄联盟全球总决赛(S15)在成都落幕。赛事期间,不仅线上观赛热度持续高涨,也有效带动了成都线下消费。抖音生活服务数据显示,10月27日至11月10日赛事周期内,成都网咖电竞、住宿、餐饮及休闲娱乐等多元消费场景均呈现增长态势,“赛事经济”动能显现。 为承接好赛事流量,抖音生活服务作为赛事独家本地生活合作平台,以“川渝兄弟节+出门观赛季”双IP联动,构建“观赛+逛吃”融合消费场景。线上,平台通过话题运营与资源曝光,带动相关品类搜索量增长超120%,相关话题总曝光量突破1亿次;线下,联合火锅、烤肉、电竞酒店及网吧等商家打造观赛主题店,推出专属助威套餐,将线上热度成功引流至线下实体场景。 线下观赛主题店 赛事直接拉动了电竞相关场所的消费热情。数据显示,成都本地网吧、电竞馆及网咖的支付GMV同比增长117%。平台通过授权21家头部商家,覆盖餐饮、电竞酒店、酒吧等多类场景,并配套主题店打造、官方周边、达人探店等资源,推动合作商家整体支付金额环比增长12%。 “决赛场次包间提前三天就已订满,当天营业额达到平日的三倍以上。”成都一家电竞馆负责人表示。在决赛门票迅速售罄的背景下,线下电竞场所成为众多观众的共同选择,并带动了周边零食、饮品等即时消费。 线下观赛主题店 跨城观赛客流进一步激活全域消费。住宿行业订单数同比飙升280%,彰显赛事强大虹吸效应;成都特色餐饮持续走俏,火锅与地方菜支付GMV同比增长50%,成为外地游客“打卡标配”;赛后休闲娱乐市场同步升温,酒吧、Livehouse、KTV支付GMV同比增长40%,洗浴按摩行业同比增长55%,形成“观赛—美食—休闲”的完整消费闭环。 “平台以独家合作身份搭建桥梁,通过观赛套餐、美食团购、主题联动等定制化服务,让赛事流量高效转化为消费动能。”抖音生活服务相关负责人表示,此次赛事的成功实践,既为商家带来实实在在的经营红利,…

    2025-11-13
    4.9K
已有 0 条评论