智东西11月3日杭州报道,今天,2022云栖大会上,阿里云智能总裁张建锋宣布,阿里巴巴平头哥自研云原生处理器弈天710实现规模部署,成为中国首个在云端规模部署的自研CPU。
作为阿里巴巴首款自研服务器CPU,倚天710自去年10月上线以来,已应用于数据库、大数据、视频编解码等多个场景。张建锋表示,使用倚天710云实例,算力性价比提升30%以上,单位算力功耗降低60%。未来两年,新增算力中有20%将使用自研CPU。
阿里云智能总裁张建锋
如今,算力已经成为与水力、电力同等重要的生产要素,云计算已经融入人们生产生活的方方面面,如何进一步提升算力效率,满足数字化转型的需求,成为全球科技企业关注的话题。
芯片、操作系统、上层应用的原生融合是必然趋势,未来十年,自研的软硬件一体化技术体系或将成为算力突破的关键。纵观阿里巴巴的技术发展,已从软件走向硬件,进入技术壁垒极高的通用CPU领域。
当下的CPU领域,流片已不稀奇,但能规模量产的“好用”处理器却不多,而骁龙710的规模量产无疑刷新了互联网公司芯片制造的天花板水平。
那么,倚天710为何在发布仅一年多的时间里,就能够如此迅速地落地?这对阿里巴巴乃至计算行业的发展路径有何影响?本文将对此进行深入探讨。
1、自研CPU广泛应用,性价比提升30%
2022年科技圈的主题是行业落地,2022云栖大会上,倚天710的新消息印证了这一趋势。
成立于中国广州,是一家营销 SaaS 公司,为全球超过 95 个国家的客户提供服务。 首席 AI 官朱小强表示:“随着广告模型架构不断升级、线上推理模型请求参数增多,我们对 CPU 性能、内网带宽的要求更高,而倚天 710 云实例很好地满足了我们业务的升级需求,实现了降本增效。”据悉,在引入倚天 710 云实例后,CPU 性能、内网带宽均有所提升,整体性价比提升超过 40%。
去年10月的2021阿里云大会上,倚天710正式发布,这是阿里巴巴首款为云而生的CPU,让阿里巴巴成为继亚马逊、华为之后全球第三家拥有自研Arm服务器芯片的云计算公司。
倚天710单芯片晶体管数量高达600亿个,在全球权威CPU基准测试集上,倚天710得分440,比业界标杆高出20%,能效比优于业界标杆50%以上,能有效帮助数据中心节能减排。
易天710上市后不久的2021年“天猫双11”活动期间,该技术就立刻受到了考验。
众所周知,“天猫双11”创造了一年来全社会最高的流量峰值,高并发对算力的性能和稳定性要求极高。阿里巴巴将淘宝核心交易系统迁移到基于倚天710的实例上,据其官方数据,此次替换使算力性价比提升了30%。
电商业务的应用只是开始,阿里巴巴在全球管理着超过150万台服务器,随着自研CPU的诞生,已经在阿里巴巴数据中心大规模部署,支撑存储、数据库、大数据、视频云等多个行业。
今年,倚天710落地步伐加快,通过阿里云,倚天710提供的算力也从企业内部走向了行业外部。据称,一些在科学计算、智能手机行业、互联网等领域的知名中国企业在迁移到倚天710云实例后,性价比都得到了明显提升。
这意味着倚天真正成为了中国首款面向大规模云应用的自研CPU,倚天710不仅能用,而且好用。
2. 突破落地难点:芯云融合潜力巨大
倚天710的成功并不容易。
如今,科技公司纷纷涌入硬件创新赛道已是趋势,但选择攻克通用处理器技术的玩家却屈指可数。
近年来,Arm 阵营在英特尔和 AMD 主导的 x86 服务器市场打开了缺口。2018 年,Arm 推出了专门针对云数据中心设计的服务器处理器。基于 Arm 架构,只有亚马逊等少数几家大公司和少数独立 CPU 公司推出了顶级性能的云端通用处理器。
研发一款高性能通用服务器芯片本身就是一项技术挑战,但这只是一系列挑战的开始,要真正实现芯片的规模化应用,还需要攻克诸多技术难关。
在这个过程中,技术团队需要针对场景做深度优化,适配不同的软件和应用生态,比如需要提供多语言、多操作系统的迁移工具,以及“原型化”的最佳实践,让用户愿意尝试,用最小的工作量完成迁移适配。
阿里巴巴技术团队在操作系统层面做了大量优化,充分适配了主流业务的关键组件,用户业务迁移所需修改的代码量为零。
之所以能有如此极致的效果,得益于倚天710为云而生的设计理念。为云而生,更容易被云使用。
云场景往往需要高并发、高性能、高能效比,因此弈天710被设计为能够提供极致物理核心性能的处理器,并通过单物理核心独享缓存有效提升性能稳定性与可预见性,让使用弈天710云实例的计算服务持续输出更稳定的算力。
生于云、用在云,倚天710云实例的规模应用,证明了阿里巴巴选择的“核心与云计算能力深度融合”的道路是可行的、可以走得很远的。
3.算力升级之争拉开帷幕,阿里巴巴亮出新王牌
知名行业研究机构IDC预测,未来5年全球算力规模将增长50%以上,到2025年总体达到每秒33亿亿次浮点运算的水平。
计算能力需求的激增对技术提出了更高的挑战。
回顾现代计算行业的发展,从大型机、小型机、PC、移动终端到云计算,人们对算力的需求也从早期的发信息,发展到发送图文、看视频、实时通话等。在可预见的未来,自动驾驶、元宇宙、人工智能等需求将推动新一轮算力升级。
计算产业正在进入软件定义、硬件加速计算的新阶段,这场算力升级的竞争,不仅比拼从底层硬件到上层IaaS、PaaS、SaaS的数据传输和计算效率,更比拼云端和大量多样的边缘端的协同集成能力。
面对这样的趋势,从这次阿里云发布会我们可以看到,阿里巴巴的新王牌,就是由“飞天+CIPU+倚天710”驱动的全新计算体系。
要追溯整个系统的起点,还得从2009年飞天的第一行代码说起。
当时,中国尚无自己的算力体系,企业只能在IOE(IBM小型机、数据库、EMC存储)架构下扩大采购规模。飞天的诞生,让算力成为一种可以在线获取的资源,以分布式体系取代传统的集中式架构,拉开了中国企业自研云计算的序幕。
2013年,飞天调度的服务器数量突破5000台,标志着早期算力基础正式完成。基于此,阿里云十余年来成功应对“双11”、“12306”春运购票等极限并发场景挑战,不断拓展云计算的性能边界,连续多年稳居亚太第一、全球前三。
随着数字经济的蓬勃发展,企业对云计算提出了强算力、低时延、高带宽等新需求,单靠软件和系统优化已经无法满足。因此,阿里巴巴开始深耕硬件,并实现了从神龙到CIPU的一系列突破。
CIPU于2021年6月发布,是为阿里云飞天操作系统设计的专用处理器。CIPU相当于云计算的CPU,飞天云操作系统运行在CIPU上,从而在云上形成统一的虚拟资源池,提供云计算能力供客户使用。无论是在分布式应用,还是AI场景测试中,“CIPU+飞天”都展现出了卓越的性能。
如今,倚天710云实例再次升级为“CIPU+飞天”,通过芯片、操作系统、计算架构和上层应用的协同优化,云计算整体性能和性价比得到大幅提升。
经过13年在算力上的耕耘,阿里巴巴已经成长为一家扎实的硬科技公司。张建锋表示,阿里云将坚持技术长征,构建下一代系统的第二条技术曲线,掌握未来技术的定义权。
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。