我们已经准备好了,你呢?

2024我们与您携手共赢,为您的企业形象保驾护航!

介绍:

企业对于技术红利的追求永无止境。过去十几年,云原生技术的普及为企业带来了显著的效率提升和成本降低,但这些技术并没有改变研发效率,企业普遍面临程序员产能不足的问题。研发效率成为企业竞争和发展的瓶颈之一。直到AI编程的出现,才真正弥补了这一短板。

阿里云发布基于统一大模型的智能编码助手统一灵码,致力于帮助开发者提升编码效率100%,帮助企业提升研发效率50%。经过半年多的快速发展,统一灵码目前拥有数百万注册开发者和超过1万家企业客户,成为国内使用最广泛的智能编码助手。

为了实现生产力的更大飞跃,阿里云正在探索实现基于多智能体的自主AI研发,并逐步推动AI程序员的成熟和落地。依托这样的产品,AI编程有望颠覆IT生产力,使程序员的生产力提高100倍,从而引发生产力革命,创造更大的价值。

前几天,云原生迎来了十岁生日。作为架构师我们都知道,在过去的十年中,微服务、容器技术的快速发展推动了整个行业应用架构的重大升级。从早期的企业级应用架构,到后来的互联网架构、微服务架构,再到现在逐渐成为主流的云架构,各行各业的企业和开发者都受益于云原生技术发展和应用带来的红利。

在软件开发的生命周期中,设计、开发、交付和运维都是不可或缺的环节。云原生技术的出现带来了显著的效率提升和成本的降低。云原生技术的发展堪称生产力的飞跃,带来了很多方面的显著提升。比如容器化编排调度、分时复用、弹性伸缩和混合部署等大大提高了企业的资源效率,让很多企业的资源利用率从10%提升到40%以上,显著降低了成本。同时容器化和云化、K8s管理和架构等技术的出现也大大提高了运维的效率,从过去需要自己维护大量组件到如今的免运维、弹性全托管。微服务、容器化、IaC等技术提高了企业软件的交付效率,使能了敏捷业务迭代。

阿里云开发者大会报名_阿里云开发者大会_阿里云开发者创新应用赛

这些技术进步大家都经历过,但企业对技术红利的追求是无止境的。回顾过去十几年,这些新技术的应用并没有带来设计和研发的根本性变革。企业普遍面临程序员能力不足的问题,软件研发迭代效率成为竞争发展的瓶颈之一。多年来,我们一直在努力提升这一部分的效率和能力,但直到AI时代的到来,才真正弥补了这一短板。

大语言模型给研发领域带来了革命性的突破。AI时代,数据的爆发式增长、计算能力的不断提升、模型技术的不断演进,为企业和开发者提供了前所未有的机遇。数据、计算、模型的协同发展,让知识触手可及。以数据为例,它已经成为全球最大的开源社区,拥有超过5000万个开放代码库。如此丰富的数据储备,让我们在大模型时代真正借助AI技术实现智能编程。

我们在分析使用情况时发现,编程问题占比29%,位居所有场景之首。这是Datos在2023年5月至6月间对通话场景调查的数据。虽然教育、内容生成、营销等各类问题也占一定比例,但编程问题无疑是最频繁使用的AI应用场景之一,表明编程领域产能不足的问题可以通过大型AI模型得到改善。

程序员一天中有多少时间花在了代码上?根据行业研究,一个程序员的工作有2/3是跟代码相关的,其中1/3花在写代码上,另外1/3花在代码相关的工作上,包括代码维护、测试、修复安全漏洞等,最后1/3花在会议、运营管理、沟通、需求分析上。虽然减少会议时间能在一定程度上提高效率,但要真正提高研发效率,最核心的方法还是要从代码效率的角度入手,让程序员把更多的时间专注于代码创作上,在单位时间内产出更多的代码,从而发挥更大的创造力和生产力。

目前程序员使用最广泛的集成开发环境(IDE)包括、IDE 和。因此,我们决定从 IDE 插件入手,利用大语言模型来帮助程序员更高效地编写代码,解决研发效率问题。这些插件可以在程序员编写代码时实时提供智能建议和代码补全,自动生成大块代码,显著提高代码编写速度和质量,减少重复性工作,让程序员可以专注于更具创造性的工作。

LLM 为人机协作带来革命

接下来我们看一下大语言模型引发的人机协作模式的演变。

阿里云开发者创新应用赛_阿里云开发者大会_阿里云开发者大会报名

第一阶段:

现阶段,大语言模型辅助程序员完成任务,但并没有改变软件工程的专业分工,而是提供了强大的工具来提升该领域的专业技能,帮助人类程序员提高工作效率。人在这个过程中起主导作用,负责提供提示词和确认。

第二阶段:代理

在这个阶段,大型语言模型作为一个agent,已经可以自主的完成一些任务,成为一个单一功能的专家,可以自主的使用工具去完成预定的任务。而人在这里的作用是在给定的语境下完成知识的对齐,使得模型能够更好的理解和执行任务。

第三阶段:多智能体

第三阶段,大型语言模型作为多智能体系统,协同处理复杂任务,多个智能体协作完成复杂任务,人类负责创造、修正和确认。

阿里云在AI编程领域的产品演进分为三个阶段:第一阶段基于IDE实现辅助编程。第二阶段依然基于IDE,让智能代理能够自主处理专业任务。第三阶段则是跳出IDE,基于多代理实现自主研发。现阶段阿里云重点深化前两个阶段,同时也在第三阶段布局和探索AI程序员方向。2023年10月底的云栖大会上,阿里云发布了基于统一大模型的智能编码助手统一灵码产品。统一灵码可以提供智能代码生成、智能代码问答等功能,帮助程序员更高效地编写代码。 统一灵码支持Java、Go、C++等200多种编程语言,兼容、、IDE、、等主流IDE和操作系统,致力于帮助开发者提高100%编码效率、帮助企业提高50%研发效率。

统一灵码构建在阿里云的MaaS产品体系上,模型推理采用PAI灵集平台、模型训练采用PAI灵骏平台、基础模型采用统一大模型、模型定制与微调采用阿里云百炼。正是依托这整套产品体系,统一灵码才得以快速搭建、快速上线、快速开发。此外,基于统一大模型的优秀能力,统一灵码在很多模型指标上都处于领先地位。以72B模型为例,我们采用超过3万亿token的数据进行预训练,在多个中英文评测中大幅超越竞争对手,并能稳定支持32K上下文。这些优势让统一灵码成为一款顶级的智能编程插件,大大提升了开发者和企业的研发效率。

阿里云开发者大会报名_阿里云开发者创新应用赛_阿里云开发者大会

上图是统一灵码的功能架构,核心组件包括数据处理、专用模型、服务器、本地服务等。语料数据是整个系统的核心支撑,我们在数据收集、数据清洗、标注、分析、效果评估对比等方面投入了大量精力,保证了数据的高质量和多样性。我们采用了混合专家模型的思路,以应对不同使用场景对内容和响应时间的不同要求。具体使用的模型包括:代码补全模型,帮助程序员高效补全代码;研发问答模型,回答编程相关的各类问题等。每个模型都针对特定任务进行优化,以提供最佳的用户体验。

此外,部分企业客户有独特的技术特点、编码风格和最佳实践。统一灵码支持企业级模型,通过自监督微调、检索增强等能力满足企业特定需求。从数据到模型,我们提供服务端和本地开发机的双重支撑。在服务端实现企业级检索增强,通过微调模型访问企业知识库,提供更符合企业需求的内容;在本地服务端实现 RAG 增强功能,对本地项目理解更深入,答案更精准。

作为程序员,我们都知道写代码最怕的就是被打断,打断会影响思考,也会影响效率。为了避免这种情况,AI编程助手需要无缝融入程序员的工作流程中。我们在生成粒度、触发时机、上下文理解等方面做了特别的优化。AI编程助手要准确理解程序员在做什么、在写什么、需要什么帮助,才能确保真正提供帮助,提高效率。

统一灵码目前覆盖了以下核心使用场景:

代码延续是统一灵码目前使用频率最高的场景,也是最具创造力的场景,它真正帮助程序员完成并编写代码,对编程体验的流畅度要求较高。单元测试生成是另一个关键的应用场景,例如对于一个函数、一个方法、一段代码,统一灵码都可以自动生成对应的单元测试。单元测试至关重要,很多公司仍然难以提高测试覆盖率,部分原因是程序员往往不喜欢写测试代码,统一灵码可以大大提高单元测试的覆盖率,减少冗余工作量。统一灵码在代码排查方面也表现出色,当遇到代码异常或者潜在的Bug时,统一灵码可以帮助查找错误原因,并提供解决方案和示例代码,让排查过程更加高效。

同益凌玛四大优势

统一灵码具有毫秒级的生成速度、完美的生成时机、合适的生成长度、贴合代码库业务场景四大优势。

我们通过几项关键技术优化,大幅提升了统一灵码的响应速度和服务质量。首先,我们实现了毫秒级的生成速度,这是保证用户体验流畅的关键。我们在IDE端采用流式补全,在服务API调用过程中设置了三级缓存,包括本地缓存、服务端缓存、模型API端推理缓存,这样就不需要调用后端API就能快速给出答案。

其次,我们分析了统一灵码的请求类型,发现20%的请求涉及研发内容问答,6%涉及代码特定任务问答,73%的请求为代码补全。对于高频的代码补全请求,我们使用专门训练的小参数模型来兼顾生成代码的效率和质量。对于代码注释、单元测试生成、代码优化、错误查找和修复等代码特定任务,我们使用中参数模型Qwen-Plus。对于对知识库、编程技能和推理能力要求更高更全面的研发问答,我们使用最大参数模型Qwen-Max并叠加RAG技术,减少模型幻读,提高问答质量。通过分层缓存和混合专家模型的结合,统一灵码的响应速度和服务质量得到了大幅提升。

为了保证程序员工作过程中不被打扰,我们对用户的键盘输入、上下文分析、历史行为特征进行了深入研究,包括主观调查、跟踪点监测分析,并持续优化不同平台用户行为的触发策略,使其更符合开发者的使用习惯。

阿里云开发者大会报名_阿里云开发者创新应用赛_阿里云开发者大会

基于代码的语义分析,该模型能够理解不同场景下需要生成的粒度,比如行级别、逻辑块级别、函数级别或者类级别。通过自适应的语义理解决策,Java 语言的代码生成准确率提升至 56% 以上,语言的代码生成准确率提升至 44% 以上,并且还有更大的优化空间。

阿里云开发者大会_阿里云开发者大会报名_阿里云开发者创新应用赛

此外,我们设计了贴合代码库的业务场景,基于库内感知进行代码生成和问答,通过实时代码语义分析、引用链接追踪、动态类型推断等方式,充分获取语义信息,避免只关注当前文件的错觉,从而提升模型答案的准确率,库内跨文件感知评测集准确率由22%提升至66.9%。

阿里云开发者大会报名_阿里云开发者大会_阿里云开发者创新应用赛

此外,我们增强了本地库搜索,在本地工作区预处理源文件,建立本地向量化索引,并基于本地 RAG 进行操作。同时,用户的代码、索引、向量信息均存储在本地,保证了代码的安全和隐私。同时,我们还实现了企业级 RAG,更加贴近企业和行业的特点,特别是针对大中型企业,它们根据自身特点有最佳实践和技术偏好。我们还在企业管理需求方面做了优化,包括用户管理、使用效果评估、数据洞察、审计日志、企业知识库、RAG 增强等,让统一灵码成为更符合企业风格和最佳实践的编码助手。

为了让开发者能够快速学习项目架构、理解设计思路,统一码支持快速查询整个项目中的相关代码,并辅助生成业务代码。比如新增一个删除文章的接口,需要分成多少部分?统一码可以基于现有的代码库结构生成这三类接口,是否使用由程序员自己决定,可以修改使用,也可以直接插入到代码版本中。因此统一码的工作范围从IDE编辑器扩展到了整个项目工作区。同时我们引入了代理的概念,不再局限于完成单个文件,而是可以理解并生成整个项目的代码。这个代理不仅可以在IDE中使用,还可以迁移到流水线或者外部工作区,提高公司现有研发流程和研发工具的适应性和灵活性。

企业为什么需要统一零码?

我们先简单对比一下市面上的产品选择,探究一下企业为何选择统一灵码,而不是其他方案。首先,目前很多程序员依赖,但在国内无法顺利接入,也无法定制调优。由于其模型服务部署在海外,存在代码数据流出海外和二次培训的风险,编程会打断程序员的工作流程。同样,不支持用户自身技术框架和技术特性调优的海外编码产品,也面临代码数据流出海外的风险。

相比之下,开源自建虽然是一种选择,但挑战巨大,并不适合大多数企业。那么,选择同益凌码到底有哪些独特优势呢?

端到端的技术体系:我们构建了完整的端到端技术体系,低成本、兼容原有工作模式、不打扰程序员、提供低延迟、高质量的代码助手。

个性化定制:企业私有域数据语料的RAG、SFT能力满足企业个性化定制需求,中文语义理解能力更佳。

强大算力支撑:统一灵码依托阿里云超级算力,采用国内最大、最优秀的模型,模型能力优势显著。

安全隐私保护:我们严格实行全链路加密,代码不存储在磁盘上,也不存储在灵玛服务器上,确保企业数据的隐私和安全。

我们针对开发者进行了调查,发现使用统一语言后工作效率明显提升,开发者满意度较高。调查显示,72% 的开发者认为工作效率有所提升,80% 的开发者认为工作不再被频繁打断,76% 的开发者认同统一语言减少了重复冗余工作,让他们能够更加专注于创造性的工作任务。

同益凌玛阶段性进展

统一灵码上线七个月来成绩斐然,目前插件下载量达350万,日推荐代码量超3000万次,相当于日均模型推理服务量超3000万次;AI生成代码采用率超31%,采用代码行数超1亿行;注册开发者超百万,企业客户超1万家,用户量位居国内同类产品第一。

统一码自发布以来,阿里云进行了广泛的推广和使用。2024年4月,统一码正式“加入”阿里云,取得了显著的成果:周活跃开发者占比达到78%,研发效率提升10%以上,AI生成代码占比超过30%。阿里云成为国内首个推动全员AI编程的云厂商。

统一码于今年5月加入中华财险。中华财险积极拥抱云+AI战略,利用统一码赋能内部研发场景,提升效率。中华财险60%以上的技术人员使用,问答准确率达90%,AI生成代码占比25%。这一系列数据反映出统一码在提升研发效率方面效果显著。

统易凌码于今年6月加入哈喽集团,不仅实现了研发效率提升12%、AI代码采用率超过20%,还将凌码与哈喽自研的“海螺机器人”对接,帮助用户实现智能代码补全和(代码审查)等。

持续探索:研发中的多智能体协作

阿里云开发者创新应用赛_阿里云开发者大会_阿里云开发者大会报名

我们可以从三个阶段来看产品实现路径:

阿里云开发者创新应用赛_阿里云开发者大会_阿里云开发者大会报名

要真正实现生产力的转化,还需要覆盖更广泛的角色范围和类型。具体来说,产品经理、架构师、交互设计师、前端开发者、项目经理等不同角色,都需要依靠智能提升效率,协同完成从需求细化到 API 时序调度、任务排序的整个研发流程。因此,多智能体系统不仅要理解和规划,还要在各个智能体之间进行交互和协同,生成专业的内容。我们也将沿着多智能体的路线不断前行,包括在企业工作空间的私有域和开放域进行增强检索,以及对每个智能体的打磨,从多个维度逐步推动 AI 程序员的成熟。

我们认为多智能体架构需要具备以下三种能力:

结构化任务管理:多代理工作模式反映了人类团队如何分解大型任务,提供了一种分配任务和协调代理的直接方法。

简化工作流程:将复杂的任务分解成更小的子任务,使得整个项目更易于管理,提高灵活性和适应性,并且可以根据公司的情况进行更多的定制,满足公司的特点和需求。

高效的任务执行:让特定智能体专注于特定任务,在各自擅长的领域进行深入的分析和执行,从而提高系统整体的执行效率。这样,每个智能体都能最大限度地发挥自身潜力,提高任务完成的效率和质量。

我们对多智能体产品的定位是为企业培养更多的AI程序员,在未来的工作模式中,我们希望人类程序员是965,AI程序员是007,这是我们期望通过打造这个产品实现的目标。从功能架构演进的角度看,底层依赖统一灵码产品中积累的能力,要将其从IDE中迁移出来,走向多智能体架构,需要从各个层面去强化产品体系。在端侧,我们不仅要覆盖更多的IDE,还要跳出IDE,融入到整个工作空间中,延伸到流水线和工具平台,因为企业内各类工种的研发协作都是在软件开发流水线上进行的,我们要把这些能力迁移到企业的研发流水线上。在本地服务方面,我们还需要实现多智能体管理、长会话管理、上下文管理等。

阿里云开发者创新应用赛_阿里云开发者大会_阿里云开发者大会报名

在服务端,我们需要增强长期记忆功能,因为研发流程和任务周期较长,需要在连续上下文中进行,不同于原子API调用,这对模型的上下文长度要求更高,因此整个系统需要全面升级。随着AI程序员的出现,一些问题也随之而来,比如未来的编程接口会不会从编程语言变成自然语言?人类程序员会被AI取代吗?人人都能成为开发者吗?

我们认为,在互联网科技行业,提供优质软件和服务的门槛非常高,竞争也非常激烈。虽然开发者可以使用各种各样的工具,但要满足千千万万个行业、千万个消费者的需求,仅靠AI开发的产品是远远不够的,还需要大量人类的顶层设计、创新创意的协同构建。因此我们认为未来主流的研发模式还是以人类程序员为主导,带领一批AI程序员完成各项研发任务。

过去20年,中国有1000多万程序员,他们构建并支撑了整个数字世界的蓬勃发展。在AI、大模型时代,我们看到依托统一灵码这样的产品,AI编程有潜力颠覆IT生产力,让程序员的生产力提高100倍,从而引发生产力革命,创造更大的价值。谁也不想错过这个时代,让我们一起创造、拥抱未来。

今日推荐文章

活动推荐

AICon全球人工智能开发与应用大会为高级工程师、产品经理、数据分析师等专业人士搭建了深度交流平台,汇集AI与大模型超全实现场景与最佳实践,希望帮助参会者把握大模型时代机遇,实现技术与商业的双飞跃。在主题演讲环节,我们邀请到了“蔚来创始人李斌”分享其基于蔚来十年创新创业的思考与实践,聚焦与AI结合的关键问题与解决方案。大会现已火热报名中,7月31日前报名可享受9折优惠,单张票立减480元(原价4800元),详情可联系票务经理咨询。

二维码
扫一扫在手机端查看

本文链接:https://by928.com/4458.html     转载请注明出处和本文链接!请遵守 《网站协议》
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。

项目经理在线

我们已经准备好了,你呢?

2020我们与您携手共赢,为您的企业形象保驾护航!

在线客服
联系方式

热线电话

13761152229

上班时间

周一到周五

公司电话

二维码
微信
线