阿里云效应团队发展历程
云霄团队的整体发展可以分为三个阶段:
第一阶段主要表现为阿里巴巴内部服务。团队规模在数十人左右。主要是前后端研发、配置管理工程师、技术支持工程师。它主要负责两个维度的工作:
通过工具将阿里巴巴集团过去几年的工程效率方法和实践标准化和数字化;
配合技术中台战略,打造研发、运维、监控三大领域的技术平台,也就是现在业界所说的“平台工程”;
这样阿里巴巴就可以通过统一的技术中台来推动内部技术的开发和落地。比如容器化、云原生化、全面上云等都是通过技术中台来实现的。
第二阶段,集团决定将技术中心的核心产品和团队划入阿里云,帮助阿里云补充其在PaaS层的核心能力。因此,云效率团队的主要目标是将性能服务产品化。
云效团队将把十年来积累的绩效改进方法实践和绩效工具转化为广大企业可以轻松实施的产品。云效团队对产品架构进行全面梳理,最终形成七大核心模块,覆盖从项目需求管理到软件开发交付的全链路一站式工具平台。
为了保证产品质量和用户体验,云霄团队根据新的产品架构对原有内部产品进行了全面重构,重点关注用户故事梳理、UI交互设计、云端改造、用户文档、性能优化和稳定性体系建设。经过大约两年的投入,新一代云效产品于2020年初完成。
第三阶段是商业化。
商业化阶段最重要的是市场洞察、销售体系、运营体系、交付体系的建立。云效作为阿里云上的产品,既需要服务直接使用SaaS的公有云客户,也需要服务私人部署的私有云客户。
SaaS客户主要是中小企业,行业集中在互联网、新零售、娱乐等,这些客户通常是自助服务,更注重产品核心能力、互动体验、品牌影响力、价格营销团队需要在内容运营、品牌运营方面加大投入。
私有化客户主要是金融、交通、政府、能源等行业的大中型企业,这些客户不仅想购买产品,还希望得到实施服务。他们更注重产品功能的丰富性、实施案例以及先进的方法和实践。性别。
云效团队需要针对不同的客户组建不同的商业化团队,并与阿里云的市场、销售部门紧密合作,有计划地覆盖阿里云的目标客户群体。
从发展历程来看,阿里云云效团队的发展有两大特点:
产品体系庞大、全面。由于其悠久的发展历史以及阿里巴巴集团的需求和阿里云的云能力的基础,阿里云的云效率团队与业内许多初创公司有所不同。不再只关注研发工具等一两个垂直维度,而是聚焦平台建设;
阿里云云霄团队虽然是在大型跨国企业内部孵化,但具有鲜明的创业团队性格。它的三个发展阶段对团队能力的训练和要求非常全面。
然而,尽管如此,阿里云云效团队和业内所有团队一样,也无法逃脱正常的业务发展逻辑,遇到了诸多挑战。
“大企业问题”和“小企业问题”
阿里云云霄团队在开发过程中遇到的问题可以大致概括为“大企业问题”和“小企业问题”。 “大企业问题”主要指目标和协调问题,以及战略目标的落实问题; “小企业问题”主要指有限资源与高目标之间的矛盾,以及团队专业能力提升的问题。
采访中,阿里云云效团队总经理陈鑫谈到了近年来商业化过程中最为明显的团队目标和协作机制问题。在商业化进程的早期阶段,阿里云云效团队选择根据营收表现来设定目标。业务人员、产品人员、技术人员都需要共享绩效指标。
事实上,这也是业内大多数团队的选择。业务经常担心后端人员商业意识迟钝,前后端协作会产生很大的冲突。这样的目标设定确实可以让所有核心成员用商业的方式思考问题,并且目标一致。 ,在沟通协作过程中更容易达成一致。比如某个行业的客户是否应该做,某个客户的需求是否应该得到满足等等。
然而,随着市场竞争进入深水区,这种目标设定模式出现了明显的问题。例如,团队更多地追求短期经济利益,而忽视长期的产品演进和客户满意度。此外,一线技术人员缺乏深入的知识。技术卓越的激励等。随着时间的推移,我们很容易发现团队的产品和技术实力陷入了停滞,收入也达到了瓶颈。
因此,阿里云云效团队近年来开始实践方法,更加注重业务、产品、技术角色之间的共识与协作,而不是纯粹的业务导向。
体现在目标设定上,首先,目标更加细化。业务团队负责营收和规模指标,产品团队负责客户满意度、产品交付能力、产品竞争力指标,技术团队负责需求交付效率、质量、成本、安全性、稳定性和其他技术进步指标。
多个角色之间的目标不是简单地拆除关系,而是延续关系。例如,客户满意度和产品竞争力决定了市场收入的长期潜力,而技术竞争力和需求交付效率则决定了客户满意度和长期产品竞争力。
其次,从组织协作的角度强调共识机制。对于一线带回的业务需求,要求商科学生和产品技术学生就业务价值、影响、预估成本达成共识,以便有效判断优先级。需求的传递强调将业务需求拆解到产品需求再到技术任务,从而实现组织的透明性和可追溯性,让每个人对所做工作的价值和目标清晰一致。
对于战略目标的落实,与阿里云云效团队的发展阶段有关。
针对不同的发展阶段,云霄团队的组织架构也进行了多次重大调整。在最早的内部服务阶段,为了实现云霄各个子产品的快速开发,云霄将产品、技术团队、测试团队整合在一起,组成了独立的全功能团队。这样可以保证每个产品资源独立闭环,决策落地快速敏捷。
在第二阶段,即产品化阶段,这种产品全功能的团队结构存在明显的弊端,主要体现在各个产品之间协调不够,导致产品一致性差,整体技术结构不对齐。一个整体,这也会导致一些基础能力投入不足,比如账户、权限、安全、私有化输出、运维能力等,因此需要组建横向团队,对基础模块进行投入和技术。例如,产品团队统一产品设计规范、架构团队确定统一技术规范、基础平台团队完成跨产品共享能力的产品实现等。
此时,云霄团队就形成了矩阵式的组织架构。
在商业化阶段,云霄团队面临的新问题是能否将来自一线的市场洞察和客户需求快速有效地传递到后端,并保证主产品线的演进不被中断。各种客户问题。
这就需要业务、产品、技术三个核心团队之间采取有效的协作方式。云霄团队主要通过两个措施解决了这个问题:
三级行业和技术团队的 OKR 设置和拆解:如前所述,业务团队负责业务指标,产品团队负责产品能力交付和客户满意度,技术团队负责需求交付和质量、成本、安全、稳定等目标。 。第三级团队不是简单的拆解业务数字,而是保证目标之间的连续性和协调性;
对各种工业和技术角色执行中的事项、优先级和时间表达成共识:例如,需求不是某人单方面决定是否做某事或何时完成,而是需要充分沟通以形成共识。在坚持市场导向的同时,确保以产品为中心的目标;
如果说以上都是“大企业”的担忧,那么可以说,云霄团队同样扮演着“小企业”和“企业家”的角色,在业务发展中苦苦挣扎。
由于云霄拥有完善的产品体系,并且注重平台能力,因此对研发和产品能力有着极高的要求。
在国内To B赛道,市场上大部分产品销量不佳的原因很简单,就是不易用,使用后无法解决业务问题。 2018年产品研发初期,阿里云云效产品在各个研发论坛上都受到了用户的诟病。团队内部总结的问题包括:在用户注册、激活流程、交互设计、性能体验等方面存在诸多不足。主板,尤其是产品架构方面,是非常有问题的。云霄多个子产品相互耦合,依赖性强。导致用户无法根据自己的需求选择一两个子产品来实现。以后他们会逐渐探索和使用更多的产品。相反,如果他们想使用它们,就必须全部使用它们。这无疑导致用户落地成本急剧上升。
承认问题的存在需要勇气,但解决问题则需要非凡的努力。大约在同一时间,阿里巴巴收购了阿里巴巴,其对产品细节的极致追求给团队带来了巨大的启发。
同时,云霄团队决心对产品进行彻底重构,这对人员能力带来了严格的要求。一方面,这次重组要求大幅提升视觉、交互、产品设计相关岗位的能力要求;另一方面,需要勇气放弃过去基于项目的思维(项目驱动、功能堆叠、缺乏复用性和灵活性)转向产品思维。在这个过程中,一方面,每个产品技术负责人需要不断提升个人能力和视野,在每个功能上线前反复细化,并在上线后不断跟踪数据和用户反馈进行改进,以保证基本的功能。产品的质量。此外,团队还需要引进优秀的产品经理。三年来,云霄产品团队规模增长了近一倍,终于完成了迭代升级。
除了主观层面,云霄团队在客观层面也经历了更大的挑战,其核心在于资源与目标的矛盾。随着2019年底春节的临近,云霄团队需要立即在阿里云上上线新版本的云霄。当时云霄的产品已经深度融合,他们只能在阿里云上重新部署一份作为云霄的产品组合来服务阿里云开发者。
施工工期仅限三个月,参与人员有十几人,时间非常紧张,整体技术难度也很高。这场让全国人民印象深刻的三年疫情,也在那个春节期间迅速蔓延。云霄团队的所有人都被封闭在家里,只能远程办公。
但团队还是在预定时间内顺利完成了改造,接入阿里云系统,并高质量完成了文档、技术支持、商业化等体系的搭建,完成了稳定性保障工作。此次出击,保证了云效业务三年来的顺利发展,完成了产品的全面升级。与2019年相比,产品能力和体验发生了质的变化。
这是怎么做到的?陈鑫表示,在云霄的发展史上,我们经历过很多艰难的节点。关键时刻,带动团队、挥舞旗帜前进的往往不是我。但团队有一种自我驱动力,自然会兴奋地去克服这些不可能的困难。这种特质让我感到非常自豪。
是什么造就了这种特质?这与企业文化、团队文化密不可分。
你相信阿里的“六脉神剑”吗?
阿里巴巴的“六脉神剑”作为一家龙头企业的企业文化,在网络上广为流传,可能有人会觉得这种文化很难落地。但在这次采访中我们发现,这套《六脉神剑》或许才是云霄战队前进的最大依靠。
云霄的CI/CD业务线早期规模很小。必须对标国际成熟团队,让CI/CD产品更适合中国开发者。陈鑫说起这件事,并没有觉得不可思议。他说阿里巴巴可以做淘宝,蚂蚁可以做支付宝。我们相信我们也可以,因为“此时此刻,就是我”。
无独有偶,代码平台团队负责人蒋欣在采访中也提到了《六脉神剑》。他最喜欢的是“认真生活,快乐工作”和“因为信任而简单”。蒋欣说:“我特别喜欢这种文化。我老婆说,自从我去了阿里巴巴,我的整个生活都变了。‘认真生活,快乐工作’就是说工作很辛苦,做自己喜欢的事,开心点。”生活也是如此,你如何对待生活,生活就会如何对待你。
“‘因为信任,一切都很容易。’有的公司信息安全严格到无法在公司内部参与开源贡献,但阿里云拥有更灵活的信息安全管控,参与开源贡献不再有太多障碍,这真正说明了‘因为信任’”,就这么简单’。
同时,在企业文化层面,云霄团队也在践行这些文化。如果客户至上,陈鑫作为云霄团队的总经理,每天都会在用户交流群里亲自解答一些开发者的问题。
整个云霄团队看重的另一个文化品质叫做“工匠精神”。
“匠心”贯穿招聘与文化
陈鑫在采访中表示:“工匠精神一方面代表着对卓越的追求,另一方面也是一种愿意长期做好一件事的心态。”
CI/CD团队负责人崔立强用一个例子来解释什么是匠心:“比如你做某件事的时候,你的方案考虑得足够仔细,还是你觉得它差不多可用?”
CI/CD是阿里云云效产品对外提供的核心能力之一。一直是产品迭代的重中之重。因此,“匠心”也是CI/CD团队工作的重要特点。
2017年,云雪产品正式进入公有云市场提供服务。当时用的是阿里云的内部架构。 2019年以来,云用户数量快速增长,原有架构在规模和可操作性方面存在一定局限性。限制,因此 CI/CD 团队决定重新开发构建引擎,以应对云用户更丰富的构建场景需求,比如更多的语言、更多的技术栈、更多样化的执行环境以及快速增长的用户需求稳定性和安全性。他们希望能够实现Any、Any、无限扩展,支持不同的计算服务,比如虚拟机、容器、阿里云的ECI,支持不同的操作系统,支持不同的芯片架构。 。这是一套庞大的能力,需要逐步、稳定地发展。
在第一阶段的发展中,即2019年底到2020年底,团队的主要工作是开发和完善上层编排能力。希望80%的用户可以开箱即用,20%的用户可以通过某些自定义配置来使用。它可以实现自己的功能,但主要需要解决的问题是场景封装、构建环境调度等基础能力。
团队主要做了两件事:一是建立“执行环境”+“执行命令”组合的业务理念,内部称为“步骤”,并使用阿里云容器服务的ACK集群作为容器调度平台;第二,一是实施专门的“定制环境建设”步骤。
该解决方案完成后,CI/CD团队不仅在两个月内完成了Linux平台下Top 5编程语言的编译、测试、扫描等能力的集成,还实现了阿里巴巴大部分编程语言的集成云PaaS层服务。集成使用户可以轻松完成从源码到上线的整个流程。
在开发的第二阶段,即2021年上半年,团队的工作重点是优化构建引擎的稳定性和安全性。保证可用性达到4个9,这意味着一年不可用时间长达52分钟。为了实现这个目标,除了服务本身的质量和可靠性之外,我们还需要关注依赖的可靠性。在提高稳定性方面,主要遵循一些通用的设计原则:
明确系统的依赖关系,确保依赖的SLA能够满足云效团队的SLA要求;
通过冗余提高 SLA;
限流及削峰填谷;
可水平扩展;
但如果将这些原则落实到制造发动机领域,仍然有许多具体问题需要解决。
例如,构建引擎依赖于阿里云的ACK集群,会频繁调用创建任务。可用性为99.95%。作为单一依赖,它已经低于团队预期的可用性。一旦发现这个SLA的不对称性,就必须通过多可用区、多集群的冗余来弥补。团队使用三个ACK集群进行热备份。当一个集群遇到问题时,可以快速扩展其他集群的容量来应对整体流量。当两个ACK集群相继出现故障时,构建引擎仍然可以提供服务。通过简单的计算我们可以知道,采用双机热备后,ACK依赖的可用性从99.95%提升到了99.9975%。
当然,要实现双机热备,还需要解决多机热备之间的调度、心跳、熔断等细节场景,保证多集群间均衡调度。单个集群出现故障后,可以及时发现并排除。聚类在避免误判的同时,需要在及时性和准确性之间取得平衡。
此外,崔立强还喜欢“极限编程”的软件工程方法,并将其带到了团队中。极限编程最早由Kent Beck于1996年提出,主要目标是减少需求变化带来的额外研发成本。有一套详细的规则和实用的方法。其中,对崔立强和他的团队最有利的两点就是“单元测试”和“重构”,节省了大量不必要的精力浪费。
也正是因为好的编程方法的实际效果,崔立强并不提倡团队加班,而是鼓励团队高效工作。
开源也是帮助团队成功的秘诀
除了“匠心”文化之外,开源也是云霄团队的重要议题之一。作为代码平台团队的负责人,蒋欣是一位资深的开源贡献者。他直言:“我来到阿里巴巴的重要原因之一就是阿里巴巴有非常好的开源文化。”
对于所有从事代码平台开发的工程师来说,是之前必须提到的一款产品。但这种设计理念并不一定适合企业级代码托管需求。
2008年,他创造性地发明了仓库分叉和代码审查(拉)的协作方法,推动了开源社区的发展。在深入了解了开源社区的运营模式后,蒋欣找到了这个模式成功的原因,即:该模式解决了开源社区期望每个人都能参与开源贡献的问题。已经是 2023 年了,当开源贡献者面对只读的代码存储库时,是否仍然只有一种方法来派生存储库?面向企业的研发协同代码平台是否有必要效仿,通过仓库推导的方式实现代码协同?人们认为,分支模式是企业协作的主要方式,但这种模式也给很多团队在分支管理和无法适应方面带来了混乱和困惑。
阿里云云效代码平台团队的一个重要任务就是突破传统惯性,打造既适合开源场景(包括企业内部开源)又适合企业内部的代码协作模式。该模式允许开源贡献者使用“git push”命令推送到没有写权限的只读开源仓库,并且推送操作直接创建代码审查。新模式允许企业用户简化代码仓库的授权,而无需管理人员的参与。任何人都可以自己创建分支、删除分支、强制代码更新和创建代码审查。
这不是闭门进行的。在打造突破性的代码协作模式的过程中,云晓团队与Git开源社区保持着密切的合作,并在2020年向Git社区贡献了Git核心的变更。
参考文章:《Git2.29让Git成功“牵手”》()
代码平台的另一个技术挑战是性能。如今业界的代码平台支持数万人同时在线协作,普遍会遇到性能和稳定性问题。几年前,云霄代码平台老架构只有一份提供写入服务,运维团队不得不24/7保持手机开机,疲于应对。后来他们也向开源社区学习。经过技术攻关,团队完成了分布式架构改造,解放了生产力。
蒋欣谈到,对此一般有两种解决方案。一是利用现成的分布式文件系统,实现计算与存储分离,从而解决代码平台水平扩展的问题;二是根据Git仓库的特点,采用仓库分片和自动存储。开发分布式多副本架构,解决代码平台架构问题。最终团队采用了第二种方案,R&D以及类似的分布式多副本架构,解决了性能和可扩展性问题。该团队目前也在开发新一代架构,以实现计算与存储分离的云原生代码平台架构。
所有这些技术挑战都从开源社区吸收了大量的养分,大到寻求技术解决方案的灵感,小到编写测试用例。蒋欣说:“我们发现Git开源项目的测试框架非常简单易用,而且测试用例的开发非常高效。然后我们在团队内部进行推广,并将其扩展到其他开发语言比C语言我们还写了技术文章来分享——《写测试用例难吗?尝试一下”()。
当然,如果你学到了一些东西,你就会得到反馈。云霄代码平台团队的很多同学都来自Git社区。云晓码平台团队在打造创新产品的同时,也在打造一支具有行业影响力的团队。云晓码团队于2021年开始打磨Git系列视频教程及训练营,与行业开发者分享Git入门指南。截至目前,已有近30万人观看。
对球队未来的思考
对于国内研发业绩领域的大多数团队来说,挑战才刚刚开始。相关报告数据显示,国内只有69%的团队发布成功率超过85%,平均故障修复时间小于1天的团队仅占总数的48.9%,不到一半。解决这些问题需要一支能够满足数字时代客户需求的优秀团队。
陈鑫在采访中提到:“云霄一直致力于为开发者提供专业、数字化、普惠的开发者工具产品。专业意味着代表最新的技术趋势和生产力,这是云霄的根本。 ,我们有阿里云非常好的技术基础和庞大的内部开发者群体来孵化。数字化意味着我们需要建立端到端的开发者工具链,构建产学研管理全生命周期的数字化模型。不仅解决了单点生产力问题,还有机会解决生产关系问题。包容意味着我们需要服务足够多的客户来降低边际成本,我们需要建立足够标准化的产品和丰富的合作伙伴生态系统来遵循我们的使命。从愿景出发,可以清晰构建云霄的发展路径和目标。
我希望云霄团队未来能够具备与其使命和愿景相匹配的技术和组织能力。首先,有一批始终追求卓越的复合型技术人员。大模型时代,要求我们不仅要有基本的工程素养和能力,还要懂数据、懂算法。一项专业可以成为一项标准。其次,有一支懂用户、匠心独运的产品和服务团队。这个团队能够深入一线开发人员和企业管理者,实事求是地解决问题,以细致的产品和服务让客户满意。最后,还有整个云霄团队的协同能力。未来,我们将继续在产学研中践行数字化管理实践,也希望与更多团队分享我们的经验,与广大企业共同成长。 ”
采访嘉宾简介:
内容推荐
本期《中国优秀技术团队访谈》对腾讯、网易伏羲、阿里云等技术团队进行深度访谈,呈现这些团队在向量数据库、大型模型、前端和研究效率。多年在施工等方面的实践经验和相关见解。识别下图中的二维码,立即查看全部内容!
今日推荐文章
推荐活动
FCON全球金融技术会议将于10月在上海开放。会议将重点关注金融业遇到的当前问题,并将重点放在数字化转型过程中的金融企业的痛苦点,例如数据治理,智能,数字风险控制,数字投资研究和数字化。有关营销,技术功能等的深入交流,请扫描QR码,或单击“读取原始文本”以查看语音主题。
目前,购买门票的特殊折扣为30%。有关购买门票的查询,请联系票务经理Ruili :(在微信上的手机号码相同)。
读者的好处
研发高性能白皮书(必需)
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。