C114讯5月21日(九九)业内普遍认为,随着大模型性能的逐步提升,AI应用创新进入密集探索期,但推理成本过高仍是制约大模型规模应用的关键因素。
在今日举办的阿里云(武汉)AI领袖峰会上,阿里云高级副总裁、阿里云智能集团总裁刘伟光扔下一颗重磅炸弹:统一千文GPT-4主力模型Qwen-Long的API输入价格从0.02元/千元下降到0.0005元/千元,直接降幅达97%。
刘伟光表示:“作为中国最大的云计算公司,阿里云大幅降低大模型推理价格,希望加速AI应用的爆发式增长。我们预计未来大模型API的调用次数将增加数万倍。”
此次降价涉及9款商用及开源系列机型
Qwen-Long是统一千文的长文本增强版,性能媲美GPT-4,最大上下文长度达1000万,售价0.0005元/千,约为GPT-4价格的1/400,突破全球底价。
除了投入价格大幅下调外,群龙产出价格也大幅下降90%,降至千颗0.002元,相较之下,国内外大厂GPT-4.5Pro、3、Ernie-4.0的千颗投入价格分别为0.22元、0.025元、0.022元、0.12元,远高于群龙。
统一千文此次降价共涵盖9个商用及开源系列模型。统一千文前不久发布的旗舰大模型Qwen-Max,API输入价格已降至0.04元/千元,降幅达67%。Qwen-Max是目前业界性能最优的中国大模型,在权威基准测试上性能与GPT-4-Turbo相当,在大模型领域位居全球前15名。
公有云+API将成为企业使用大模型的主流方式
刘伟光认为,无论是开源模式,还是商业模式,公有云+API都会成为企业使用大模式的主流方式,主要有三点原因:
首先,公有云的技术红利和规模效应带来巨大的成本和性能优势。阿里云可以从模型本身和AI基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极其灵活的AI算力调度体系,结合百联分布式推理加速引擎,大幅降低了模型推理成本,加速了模型推理速度。
即便是同样的开源机型,在公有云上的调用价格也远低于私有部署,例如采用月用量1亿的Qwen-72B开源机型,在阿里云百联上直接调用API只需600元/月,而私有部署费用平均每月在1万元以上。
第二,云上多模型调用更加便捷,提供企业级数据安全。阿里云可以为每个企业提供专属的VPC环境,实现计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前阿里云已经主导或深度参与了10多项国际国内大模型安全相关技术标准的制定。
第三,云厂商天然的开放性,可以为开发者提供最丰富的模型和工具链。阿里云百炼平台汇聚了统一、百川、Llama系列等国内外数百种优质模型,内置大模型定制和应用开发工具链。开发者可以轻松测试和比较不同模型,开发专属大模型,轻松构建RAG等应用。从模型选择、模型调整、应用构建到对外服务,一站式搞定。
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。