记者 张永毅
编辑 高玉蕾
智能助手这个概念从诞生之日起就离不开人类对于AI的想象,Siri最初作为独立助手发布于2010年2月,后来苹果在2011年4月收购了Siri,并将其整合到4S之中。
从那时起,Siri 就成为了苹果设备的标准功能。语音助手逐渐成为智能手机的标配功能。
随着大机型成为时代主流,人类再次看到了让手机像人类一样聪明的一线希望。2023年下半年开始,小米、OPPO、vivo等手机厂商纷纷宣布入局,组建团队,在新体系中加入大机型能力:在连续几年市场体量萎缩之后,手机厂商们将希望寄托在AI机型能成为未来五年甚至更长时间持续吸引用户更换手机的增长点上。
大机型出现在手机上,确实成为了2023年手机行业最热门的话题:到了2024年1月,国内TOP5手机公司,除了苹果之外,都发布了自己的端侧大机型产品。
从无人关注到赛道人头攒动,只用了半年时间。随着发布会上手机厂商们演示的自动生成通话记录、AI图像处理等常见应用场景的融入,如今已经没有人怀疑大屏在手机上的前景。
但我们距离像人类一样聪明的终端侧大机型手机还有多远?
自研大模型真实性的困惑
创始团队的规模往往可以说明很多问题:小米建立了3000多人的AI团队,vivo也已经有上千人的团队在生成式AI领域从事产品研发。
虽然已经组建了大规模研发团队,但围绕AI大模型产品自研的争议从未消失:手机厂商在发布大规模端侧模型产品时,都会花很大篇幅介绍自己在AI领域的长期投入,但这其实混淆了语音助手背后的大模型的本质。
大模型的实际供应商无疑是手机厂商的秘密,但从手机厂商在生成式AI领域的投入步伐,仍可以看出一些端倪。
据相关厂商内部人士透露,vivo现在的大机型是在智浦AI的基础机型上改进而来,小米本身也是智浦AI的股东,并于2023年10月参与了智浦AI的投资;在今年4月的阿里云峰会上,阿里云官方发布的“企业专属大机型”合作名单中,OPPO位列第一。
该业内人士还向记者透露:手机厂商花费数千万元的投入购买基础机型,是为了使作为语音助手呈现给普通用户的大机型产品最终能够适应硬件的架构,并提供超越大机型标准的体验。
对于这些厂商来说,目前自研的大模型目前无法满足用户对于大模型能力的需求,因此主要选择就是从市场上购买现成的预训练模型,并在此基础上进行调整。再加上发布时的营销手段,让购买的预训练模型不经意间变成了“自研”。
此外,由于现行《生成性大机型管理服务暂行办法》带来的监管白名单制度的存在,手机厂商想要赶上这波热潮,采购现有的大基数机型,并在此基础上进行微调,此前的“自研”是针对当下情况的短期快速解决方案,“抢先推出”是为数不多的选项之一。
但在注定是一场马拉松的终端侧大车型竞争中,这种先发优势还能保持到何种程度,令人怀疑。
硬件天花板在哪里?
目前各手机厂商公布的多模大模型方案中,端侧大模型在各类尺寸中处于最低水平,参数数量往往只占前百分之一,实际运行结果自然也存在差异。
但客户端大模型的价值是毋庸置疑的,它就是为了解决云端大模型诞生以来就存在的各类问题,用户每一次对云端服务器的请求都会产生一定的成本,同时也是解决用户数据隐私问题的根本方法。
大模型技术的快速进步在便利了我们的生活的同时,也带来了前所未有的隐私暴露风险:斯坦福大学一组研究人员近日公布了一个使用10万个随机地点和50万张街景图片训练出来的大模型,能够从照片信息中快速识别出拍摄者的当前位置,准确率高达92%。
目前不同手机厂商的策略略有不同,但设备端大模型是任何厂商都无法避免的必选项:完全在设备端运行的大模型未来会变得更加重要。
解决了技术路线问题之后,剩下的主要问题就变成了硬件:70 亿参数级别目前是“甜点级”的关键节点,而 70 亿参数大模型正常的模型大小在 28GB 左右。为了真正在设备端部署,对模型进行压缩轻量化,目前可以将其压缩到 3.9GB 左右,无论是存储还是内存占用。
但在减小模型规模、提高运行性能方面还有很大的进步空间:目前开发者甚至可以在2004年发布的诺基亚9500的硬件上运行一个包含70亿个参数的大型本地模型。
AI:2004 年诺基亚 9500 上的 7B 大型型号
这一方面体现了近一年来设备上大型模型的开发和迭代速度惊人,另一方面,专门为AI设计的硬件可以大大提升现有水平上大型AI模型运行速度的上限,如今搭载TPU的系列处理器在离线环境下已经可以达到每秒20个Token的处理速度,相比之下桌面版Air M2仅为每秒5个Token。
移动端实现了超越桌面端的token处理速度。这得益于从硬件设计之初就考虑到了深度学习:例如与三星联合定制的系列SoC就集成了用于人工智能加速器的专用集成电路(ASIC)。这让它相较于其他厂商拥有巨大优势:这种优势不仅会体现在2023年大屏端机型的推出浪潮中,在后续的竞争中也会更加明显。
高通在硬件上也通过多年的布局形成了类似的生态系统,最新发布的高通骁龙8 Gen 3 SoC芯片已经支持设备端百亿参数(10B)级别大模型的离线运行,并展现了在手机端运行的能力。
大端模型的天花板目前主要体现在手机运行内存的压力上,这也是现阶段手机厂商普遍只选择旗舰机来测试大端模型的直接原因。因此除了硬件的专注设计,模型本身的性能优化也依赖于模型的迭代,而这需要云计算业务提供海量算力的支持。
端侧大模型所强调的“利用手机闲置算力保障用户数据安全”的前景看似诱人,但现阶段还不是一个能够支撑足够用户体验的解决方案,其定位现阶段更多的是云侧大模型的补充。随着端侧大模型能力的提升,很快会看到新的变化。
不管是华为、谷歌,还是尚未入局的苹果,过去的芯片设计中都早已为AI适配了专用的算力,尤其是已经出现几年的NPU,直接决定了端侧AI的智能程度,谷歌和华为都针对自研芯片中的AI算力进行了大量的能效优化,这直接考验着手机厂商对于硬件的把控能力。
生态挑战
基于现有的语音助手形态,融入端/云端大模型的交互入口,是目前门槛最低、相对实现效果最好的移动端AI大模型交互。
门槛低也意味着更多强劲竞争对手的涌入:几乎没有人愿意放弃接管手机智能助手的可能性。据悉,在近期的更新中,增加了在桌面端工作的功能,允许用户在手机上设置为默认语音助手,并直接调用拼多多-4的语音交互能力。
但手机硬件厂商也有自己的优势:利用大模型能力,进一步完善现有手机硬件的第一方能力,是目前几乎所有玩家的共同选择。
去年11月首次面向公众发布时,为了更好地展现其在设备端的应用场景,集成了14款内置的录音机App和英文输入法,可以更快地将录制的语音转换为文本,并提高准确率。
相关阅读:
在目前国内手机厂商的发布中,端侧模型应用也在本地图像识别、处理、通话记录等领域展现出了惊人的能力,因为这些概念对于手机厂商来说并不陌生,而在AI模型概念被广泛知晓之前,手机侧就已经存在不少AI、深度学习技术的应用场景:从手机计算摄影到后台内存调度,再到桌面交互动画,都有AI技术的影子。
但更富想象力的应用场景,依然是第三方应用生态:智能语音助手本身就具备“捷径”的功能,可以打通应用层面,帮助直接访问某一特定功能,比如打通日历、支付、订票等APP,帮助用户一键预定高铁/机票。不过,如此梦幻的场景,对于大端到端的模式来说,看似触手可及,但其实现还面临更多阻碍。
长期以来,手机厂商都深知用户不懂用语言助手的问题:在OPPO发布Andes GPT后,OPPO首席产品官刘作虎就曾表示,“不做大机型的手机公司就会倒闭。”他在接受媒体采访时表示,“真正用智能助手的用户并不多。”
语音助手长期“低能”的现实,让即便是投入AI领域多年的智能手机厂商,也有意无意地忽视了构建生态的重要性。开发生态的投入,远远落后于硬件和生成式AI产业的发展。即便小米、华为、vivo、OPPO在2023年相继发布了适配大规模终端侧机型的开发者开发规范,但如何将更多的应用服务快速融入自家生态,依然缺乏有效的解决方案。
像妙牙相机这样的独立生成式AI应用的火爆,也正在鼓励更多第三方应用甚至独立开发者加入大机型竞争。不过,这更多的是“各自为战”,并没有足够的利益。在手机厂商的驱动下,手机厂商很难高效地将这些第三方APP整合到自己的大机型产品中。
“其实正是因为大机型具备真正颠覆体验的潜力,才使得存在多年的深层次问题暴露出来。”一位手机大机型产品经理告诉记者。
为了解决这个问题,手机操作系统中像“强力胶”一样的通用接口,将像“基础设施”一样成为未来大机型生态中不可或缺的一部分:随着14的发布,API也已经集成,开发者可以自由适配自己的App,调用本地能力。未来还会有更通用的API开发接口,适用于所有大端侧机型。
但这样的更新依赖性很强,在这一点上还是要以官方的更新节奏为准。“行业内缺乏统一的开发接口,会成为未来必然事件,因此有硬件、有生态的厂商后发优势会更明显。”这是这位大机型产品经理对未来端侧大机型生态状态的看法。
归根结底,大模型的概念最终还是会在手机上落地,与应用生态的深度融合几乎是必然。生成式AI能在多大程度上真正接管手机的日常使用也取决于此。这将是手机厂商与位于生态链下游的开发者竞争与合作的新战场。
现在判断谁是赢家还为时过早,但手机无疑是最适合大机型成长的终端设备之一,而大家所期待的终端侧大机型带来下一个“瞬间”,更有可能的是最终在拥有完整大机型开发能力、芯片设计能力、制造能力和生态号召力的厂商中诞生。
手机厂商大规模端侧模型的第一轮较量已经结束,手机端侧模型大爆发已初现端倪,但真正的领头羊还未出现,只有当AI大型模型真正成为智能手机的“质变”,用户自然愿意为更好的体验买单。
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。