苹果,还有没有“大招”了?
如同命运般的,在乔布斯去世的前一天,Siri问世。
在Siri还只是苹果商城里的一款APP时,乔布斯发现了这款软件,他瞬间意识到这个产品可能会创造下一个“iPhone时刻”,立刻邀请Siri创始团队到家中。
Siri 的联合创始人 Dag Kittlaus 曾经说过,Siri 的终极目标是:你可以对着互联网说话,助手会为你处理一切。你甚至无需知道信息来源,应用和网站发现的问题也将被解决。
十四年后的今天,我们都知道,这不就是如今所有大厂都在喊着的“AI智能体”嘛!而十四年前,AI这个概念还没有被抬上桌的时候,乔布斯就已经预见,这款软件可以改写苹果的命运,并且决定收购Siri。
然而,十四年过去了,在今年WWDC之前,传出了“大模型版Siri”延期的消息,甚至整场WWDC,Siri仿佛“消失”了一般。
与此同时,原本要通过与阿里和百度合作入华的Apple intelligence同样宣布再次延期。
这场原本就被预测有些“无聊”的发布会意料之中地没有给苹果股价起到提振的作用,当地时间6月9日收盘,苹果股价跌幅1.21%,总市值为3.01万亿美元。
图片来源:百度股市
今年用一季度,苹果在国内高端手机市场的市占率是47%,这个数字距离两年前已经滑落了20%多,抢跑十四年的苹果,为什么在AI上没“憋出”大招呢?
01 没被提及的Siri
苹果,是懂预期管理的。
即使是提前放出了Apple intelligence入华没有通过审核,以及Siri升级延期的消息。这个深谙设计语言的科技公司还是在6月10日凌晨的WWDC上给出了一个重要的设计变革——Liquid Glass(液态玻璃)。这种半透明质感可反射和折射周围环境,并随内容动态变化,帮助用户更聚焦于核心内容,为控件、导航栏、应用图标、小组件等元素赋予全新活力。
这也是继2013年iOS7抹去了仿真皮革、金属钉扣等拟物元素,用纯色块、纤细字体和层次分明的半透明图层重构了数字界面逻辑之后的十二年里,苹果再一次在设计语言上做出的重要调整。
图片来源:WWDC直播
“在苹果,我们始终相信硬件与软件的深度整合能让科技交互变得直观、美观且愉悦,”苹果人机界面副总裁Alan Dye是这样说的,“这是我们有史以来最大规模的软件设计更新。我们重新思考了构成软件的基本元素,精心打造了名为‘液态玻璃’的全新材质。它将玻璃的光学特性与苹果独有的流动性相结合,可随内容或场景动态变化。这一设计为未来的新体验奠定了基础,最终让最简单的交互也充满趣味与魔力。”
当然,还有此前大家已经知道的消息,苹果的操作系统将采用年份命名,替换掉过去每个版本的连续编号,这将统一苹果产品的命名惯例。这也意味着,所有苹果产品即将推出的最新版本软件都将以数字26结尾,即iOS 26、watchOS 26、tvOS 26、macOS 26、visionOS 26 和 iPadOS 26。
图片来源:苹果官网
Apple Intelligence的系列更新也是这场发布会的重点。苹果正在加深与OpenAI的合作,宣布将ChatGPT的图像生成功能添加到其Image Playground应用程序中;翻译功能或将成为下一代操作系统中Apple Intelligence的标志性功能。在演示中,苹果团队透露,将把实时翻译集成到信息、电话和FaceTime应用中。
虽然更新繁多,但是对于熬夜守着直播的中国果粉来说,这场发布会还是令人失望的,因为大家最期待的Apple Intelligence入华和Siri升级都还没有消息,甚至整场发布会,Siri几乎没被提及。
图片来源:WWDC直播
同样是宣布延期,Siri升级和Apple Intelligence入华遇到的困境或许完全不同。
在之前官宣Siri升级延期的声明上,苹果是这样说的“Siri 帮助用户快速找到所需资讯并完成各种任务。 在过去六个月内,我们让 Siri 更具对话能力,推出了‘打字给 Siri’和产品知识等新功能,并整合了 ChatGPT。我们也一直在开发更个人化的 Siri,使其能更理解用户的个人情境,并能在各个应用程式内执行操作。不过,要让这些功能真正落地,比我们预期的还要花更长的时间,因此我们预计会在明年陆续推出。”
从这份声明中我们可以体会,Siri升级的延期更多是由于技术的挑战。去年Apple intelligence首次亮相的时候,苹果就宣传了Siri的上下文理解能力,不过这个功能被一波测评博主吐槽了。为了增加这个能力,苹果研发了一款 ChatGPT 和 Google Gemini 的 Siri LLM(大型语言模型)版本,不过随着Siri升级进度的延期,生成式 Siri LLM也可能会延到 2027 年 。
另外一方面,在声明中没落地的“个人化Siri”功能指的可能是追踪电子邮箱、照片、档案等讯息并且进行深度整合。举个例子,直接拆解工作邮件中的重要内容然后罗列在日程上,按时提醒用户,这种非常贴近Agent的功能。当然,这也涉及到Siri能够调用的苹果自带的以及三方APP的量级,因此这次发布会上,苹果也表示现在正在向第三方应用开发者开放其设备内置的基础AI模型。
在保证软件升级的同时,苹果也要保证硬件使用的丝滑,避免因为“Siri AI”上线导致的电耗、卡顿等问题。这可能都是造成这次升级延期的技术难题。
图片来源:苹果官网
至于Siri的升级要推迟到“明年”的什么时候,业界普遍认为最早也要在明年的WWDC。
而Apple Intelligence入华的延期,则更多是数据安全和政策层面导致的。
为了增强AI实力,苹果在Apple Intelligence中用了混合架构,简单任务由设备端处理,复杂任务则通过加密传输至云端AI模型进行运算。在海外市场,苹果是与OpenAI合作来增强Siri等功能的。
不过为了入华,这套方案显然不能成立。所以苹果搞了一个“双轨制”的设计,试图通过阿里“通义千问”和百度“文心一言”的本地模型来实现内容合规与隐私保护,结果这项方案也在前几天传出尚未获批。
几乎“消失”的Siri、入华待定的Apple Intelligence,苹果在AI上的进展,可以说“没什么惊喜”。
02 没有走通的AI之路
我曾经跟一位Agent创业者聊过一个问题:为什么AI大爆的产品几乎都来自于初创团队而非大厂?
这位创业者是这么回答我的:我们最大的优势就是没有大厂的劣势。对于任何一个有稳定营收的大厂来说,接受AI需要强烈的自我革命意识,这本身就是巨大的挑战。
如今回看苹果AI从抢跑到落后,完全印证了这句话。
2018年,苹果从谷歌挖来了一个AI大咖,被业内称为JG的John Giannandrea来担任苹果AI的负责人。JG之前在谷歌负责搜索和AI部门,并且带领团队在谷歌相册、翻译和Gmail等产品中部署AI技术。
图片来源:苹果官网
在当时苹果的新闻稿说,库克是这样说的:“机器学习和AI对于苹果公司的未来发展至关重要,它不仅会彻底改变人们与技术进行交互的方式,而且已经为用户的生活带来了显著改善。能够与John携手并肩,我们感到非常幸运。作为AI领域的领军人物,他必将能够推动我们在这一关键领域的长足发展。”
不过这位被寄予厚望的大咖并没有让苹果AI突飞猛进,反而是让苹果的AI战略陷入了两难。
众所周知,AI研发劳民伤财、九死一生,JG加入苹果之后就发现苹果需要多投入几个亿美元,来做大规模测试以及图像和文本标注来训练大模型。他赶紧从谷歌带来顶级的AI研究员,组建负责测试和数据分析的团队。而后JG将矛头对准Siri,撤换负责人,提议砍掉Siri很少使用的功能。
不过,这样的做法在苹果内部并没有得到所有人的支持。
苹果内部对AI一直有两种不同的看法,一部分高管认为iOS应该尽快潜入AI功能并且认为这将会是一个“game changer”,但另一部分则觉得苹果团队应该专注于原有的软件开发和升级而不是去押注一个费钱、费力还未必有什么回报的未来科技上。
很不幸的是,苹果的软件负责人Craig Federighi,在当时属于后者。
要知道,苹果很多高管在公司已经任命了十几年,他们俨然像个家族企业一样,JG作为一个空降的高管,又负责着一个当时没有任何迹象能够大爆的新领域,这种来自外力引领的革命会更加艰难。
而JG本身对AI的理解也是“求稳大于求快”即使在内部开发受阻的情况下,他仍然对于chatbot这种形式是否能体现AI真正价值存疑。他坚持希望苹果展现给用户的AI功能不是一个APP而是在主页面上体现。
一方不够坚决,另一方则不够重视。这种温吞的状态一直持续到了GPT的大爆,以前不重视AI的Craig Federighi在亲自用GPT了之后立刻说道:咱们得在iOS18上更新点AI。
终于统一了内部战线的苹果在去年推出了Apple intelligence。一直以来苹果的哲学都是“不求最快,但求最好”,即使后发也能制人,这是果粉对苹果的滤镜,但是这份滤镜在大家亲测了Apple intelligence之后开始逐渐瓦解。
图片来源:苹果官网
小红书上关于Apple intelligence的吐槽甚至比正儿八经的测评更火。
“Apple intelligence没那么intelligence”这就是大部分用户对这项功能的印象——首先就是功能的鸡肋,苹果在发布会上对于Apple intelligence的演示其实很接近大家对Agent的畅想了,但是落实到实际上的功能还是仅限于日程提醒、邮件总结、复写。
图片来源:小红书
不可避免地,这些功能就会被和GPT比较。这么一比,也就落了下风,比如接入大模型的Siri号称也有上下文理解能力,实际上效果差强人意。一个测评博主就先是问了Siri香港天气如何,在Siri作答之后再请求Siri来出一个今日去香港需要准备的东西,结果Siri似乎完全忘记了刚刚关于天气的对话,在接下来的回答中并没有把天气考虑在出行的设计当中;再比如,邮件总结被吐槽抓不住重点、wiriting tools只能用在苹果自带APP中并不能跨APP通用,等等。
其实Apple intelligence的落后也是一直以来苹果内部对于AI策略摇摆的“回旋镖”。
算力和数据是AI成功的必要条件,但是苹果此前策略的摇摆导致公司对于GPU的采购策略非常保守,就在微软、META都在囤货GPU芯片的时候,苹果这一步就走慢了。
天风证券郭明錤曾经分析过,Meta Platforms预计将在2025年采购130万颗图形处理单元(GPU),这一数字相当于苹果传闻采购量的70倍。他强调,英伟达GB300 NVL72芯片专为高性能计算设计,但"小规模采购无法支撑苹果在生成式AI领域的重器研发"。(新浪财经)
更让人惊奇的是,有20多亿活跃设备的苹果居然也会有数据不够“大”的问题。这也是由于几年前苹果的另一策略导致的——数据隐私。
图片来源:苹果官网
2020年前后,AI还没有成为公认的智能手机创新王牌,全球智能手机出货量都在面临6%左右的同比下滑,延续在iOS上持续发力的哲学,苹果祭出了另一个差异化竞争的点子:隐私。iOS14.5之后更是直接让用户选择是否愿意被APP采集基础数据。越来越重的隐私规则也成了苹果采集用户行为数据的一堵厚厚的墙,反而拖慢了AI的研发。
摇摆的决心、落后的硬件储备、难以攻克的隐私大关,只能说苹果AI的落后并不是偶然。
03 从软件到硬件的威胁
一边是跑在后面的苹果AI,一边是极力追赶的国产品牌。
GPT出现之后,宣布进军AI的手机厂很多,比如魅族、OPPO、vivo、三星,当然也包括苹果。除了苹果的Apple Intelligence,荣耀的 YOYO Agent 和 vivo 的 PhoneGPT也相继发布。
这个时候我们不得不问出那个问题:苹果会不会变成下一个诺基亚?
诺基亚曾经喊出一句响彻全球的企业愿景:科技以人为本,而它的陨落也正是因为忽略了这套哲学。如今,苹果是不是也走上了没有“以人为本”的“不归路”呢?
或许,在Apple Intelligence更之前的Vision Pro也能说明问题。XR头显有三大痛点:沉、续航短、场景少。如果遵循“以人为本”,Vision Pro就应该在这三项上下功夫。很可惜,苹果没有做到。在续航和机身重量没有绝对优势的前提下,苹果作为一个生态大户也没有给Vision Pro什么killer App,这个价值2万多人民币的科技玩具的销量不出意外地不尽如人意。
但是从当年华强北版的火热程度也能看出,大家不是不愿意给科技玩具买单,只是不愿意给没有解决真正问题的科技玩具买那么贵的单。
图片来源:海豚投研
同样被诟病的,是iPhone这几年被称为“挤牙膏”的创新,和与之相对的,信号问题、垃圾来电提醒、通话同时录音等等安卓手机早就解决的,看似微小却可以提升用户体验的,却一直被苹果拖延解决的问题。
在当下的叙事语境中,智能手机通向Agent是一个公认的大趋势。
图片来源:36KR
什么是Agent phone?可以用之前手机圈里非常流行的“给我买一杯咖啡”这个场景来解释。
你现在要买一杯咖啡,于是乎打开手机,通过Siri下一个指令——帮我买一杯咖啡送到我的办公室,iPhone可以自动打开外卖APP列举一堆在配送范围的咖啡店,点单、付款、配送,这就是Agent。
以我们现在的想象力,我们可以粗暴的理解成,Agent可以从目前AI最常用的对话场景,延伸到“行动”,它不仅仅是用语言而是可以用行动来替我们解决问题。
要实现这一步,就要跨过几座大山。
图片来源:苹果官网
跨APP的合作,必然是一个。之所以初代Apple Intelligence调用的基本都是苹果自带的APP,因为第三方APP需要授权。这个时候手机厂可以和APP去谈合作,让APP后台开放这个调用的API。
不过,这个合作,并不好谈,其一,大多数APP都有一个变现手段就是广告,用户打开APP,会有展示页,进入之后顶部有BANNER,下滑有信息流,商品展示有先后顺序,这都是广告位的好机会,而Agent为了增加用户体验大概率就是直接弹屏到需要的页面,一下子就流失了几个展示广告的位置;其二,数据,在AI时代可是珍贵的资产。手机成了Agent,一谈合作把各个APP的用户数据搜索个遍,来训练自己的大模型,APP倒是给手机厂做嫁衣了。
用户体验,更是一个难题。很多人并不是从一开始就很清楚地知道自己的诉求的。就拿“买咖啡”来说,没有Agent的情况下,用户可能是打开美团,看看有没有优惠券、翻翻有没有新口味,最后再纠结一下是喝冰的还是喝热的。
在我们人为操作的时候,不会认为这中间哪个步骤是不合理的,但是当Agent来代劳的时候,这种体验的丝滑就很难设计了。就比如,Agent应该在什么尺度,以什么频率来询问用户呢,如果弹开一个页面,问一次、选择口味,问一次、确认付款再问一次,那么Agent代劳的无非就是打开界面搜索这个步骤,十分鸡肋。但如果自作主张直接下单,又可能显得非常鲁莽。
这个交互的尺度直接影响用户体验。
更别提实现这种从理解到行动再到操控级别的跨度背后的技术难度,Agent要从一个很可能模糊的、不够明确的指令中拆解、思考、决定下一步要做什么,及时响应、反馈。
别说智能体了,就算年薪五十万的秘书,都可能会错领导的意图呢。
图片来源:百度
一直以来,苹果用硬件收割用户,用软件收割开发者,在整个生态中都处于强势地位,但Agent的趋势可能会完全改变这一点。要实现一个完整的Agent,不论是和APP的合作还是对用户体验的重视都是对手机厂商至关重要的挑战。
在通往Agent的路上,苹果能不能坚持“科技以人为本”才是能不能创造下一个“iPhone时刻”的关键。