豆包能挑起字节AI重任?
撰文 | 曹双涛
编辑 | 杨博丞
题图 | IC Photo
字节正调动集团全部资源全力扶持豆包发展。
在获取用户增长上,除抖音上线AI搜索功能、消息页面推送豆包、平台博主内容植入等方式为豆包引流外。投流为当前AI产品获取用户增长的重要方式,2024年Q4和2025年Q1 kimi和元宝单季度投流消耗费用分别高达5.3亿元和14亿元。
图源:抖音
2024年Q2至2025年Q1,豆包季度平均投流费用为1.5225亿元。作为对比,字节旗下即梦AI投流费用从2024年Q3的1.4亿元被大幅压缩至2025年Q1的270万元。
图源:基于App Growing公开数据整理 DoNews制图
在当前AI厂商疯狂投流带动广告平台营收增长之际,腾讯财报显示,2024年腾讯营销服务收入同比增长20%至1213.74亿元,增幅和后起的B站、快手等平台持平。或许是为了给豆包铺路,巨量引擎主动放弃这块“肥肉”。
今年3月份,包括元宝、kimi、通义千问、智谱在内的多款AI产品在巨量引擎消耗的广告费用占比均不到5%,部分AI产品占比更是不到1%。
图源:基于App Growing公开数据整理
不仅如此,为获取字节系APP以来的流量,豆包超90%的广告消耗金额同样放到腾讯广告上。组合拳的打出,让豆包今年3月在国内及全球AI 产品MAU榜单中均稳居TOP3之列。
图源:AI产品榜
图源:AI产品榜
在内部组织架构的调整上,字节除引入在谷歌工作17年的吴永辉博士外。今年3月字节豆包大模型部门(Seed)全员会上,明确Seed部门最重要的目标是探索智能上限。吴永辉强调长期研究的重要性,并指出会为Seed Edge提供充足的算力,并将持续在内外部招募最具潜力和好奇心的研究人才。
在AI Agent布局上,字节同样按下快速键。近日,字节旗下云和AI服务平台火山引擎面向TOB市场发布更强的模型——豆包1.5深度思考模型,这是豆包背后的推理模型首次亮相。一同推出的还有豆包文生图模型3.0以及升级版的视觉理解模型。
但结合对豆包的实测来看,文生图的图片难以商用,AI检索数据错误,逻辑推理的自圆其说等问题的存在,意味着字节仍需持续提高豆包能力。更现实的问题是,未来豆包在TOC和TOB的商业化之路又要如何走呢?
一、误报仍无法避免
我们将检索“表格中老凤祥、中国黄金、老铺黄金等上市黄金珠宝企业的门店情况”指令给到豆包,豆包输出的企业门店情况存在诸多错误。比如,中国黄金财报显示,截至2023年末中国黄金开业门店合计4257家。老铺黄金财报显示,截至2024年末老铺黄金共拥有线下门店36家。
作为对比,豆包给到的中国黄金门店数量约4600家。截至2024年上半年,老铺黄金门店数量为168家。与之而来的问题,中国黄金和老铺黄金分别多出的超300家和超百家门店,难道是“不差钱”的豆包开的吗?
图源:豆包PC版
不仅仅是豆包,DP存在编造数据的问题。我们通过硅基流动完成DP本地化部署,DP-R1在回答华彬红牛问题时提到,华彬红牛2022年财报中首次出现负增长(-3.6%)。但华彬集团在A股和H股均未上市,财报中的负增长数据从何而来?
图源:硅基流动
哈尔滨工业大学和华为的研究团队发表的综述论文曾指出,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。上述问题的存在,让AI大模型在处理数学推理问题时,很容易出错。
时至今日,豆包仍未能很好地解决该问题。我们将2024年高考新课标Ⅰ卷数学的第18道真题给到豆包,在第3问求解过程中豆包自圆其说地给出完整分析,但其给出的答案并非正确答案。
图源:2024年高考数学真题
图源:豆包PC版
此外,豆包文生图模型3.0生成的图片,短期内难以直接商用。我们将“请以浅咖色背景、碟子中放牛肉酱实物、外层几粒牛肉、后面放置牛肉酱瓶子、卖点为7个字生成电商平台主图”,指令给到豆包文生图模型3.0,其生成的图片存在不少问题。
一方面,生成的图片不仅未能展示7个字的卖点,且文生图模型3.0更误将“7”单独提取为视觉符号。这里很容易给用户带来“7”到底是品牌名称,还是“7”种口味,再或是产品到第“7”代等误导。
图源:豆包PC版
另一方面,部分图片牛肉酱实物过大,品牌被弱化;实物采用贴画风格设计和主体关联性弱,以及牛肉酱核心消费群体存在差距;或使用罐装包装和牛肉酱多以玻璃瓶包装不符;或将各种元素简单堆砌,整个图片欠缺主次之分和美感。
图源:豆包PC版
我们将难度升级,让豆包文生图模型3.0根据下图要求,同时处理多条指令,生成终端家电门店促销海报。但豆包文生图模型3.0直接显示“我们换个话题聊吧”,无法生成所需海报。
图源:豆包PC版
图源:豆包PC版
全球人力资源公司德科指出,全球范围内近30%借助AI节省时间的员工,正将更多精力用于核查工作准确性,并投身于更富创造性的工作。超过25%的人认为,他们能够更好地平衡工作与生活,并进行更具战略性的思考。
但豆包给出的数据缺乏严谨性,生成图片无法直接商用,技术限制带来的数据幻觉等问题的存在,让不少用户对使用豆包愈发谨慎,尤其是对内容高度严谨的医疗行业。
国内某三甲医院重症呼吸科主治医师张宇(化名)告诉我们,AI没有处方权叠加越来越多的医生担忧AI输出的内容存在问题,让自己所在的科室使用包括豆包在内的AI产品频率逐渐降低。
从事中医近40年的林磊(化名)同样表示,AI产品多是对现有数据进行优化组合,甚至部分AI产品仅是简单地对互联网信息完成整合加工。在不考虑季节、病因、患者体质存在不同情况下,AI开出的中药方剂治疗效果真的会好吗?担忧之下,越来越多的同行仅是把AI产品当成是辅助工具而已。
更现实的问题是,包括豆包在内的AI产品将网络平台现有信息完成加工整合,真能给不同用户带来深度思考吗?比如,我们将“如何看待当前国内零食折扣店的发展?25年下半年会出现倒闭潮吗?”
指令给到豆包,豆包给到的回答是:2025年下半年国内零食折扣店可能会出现一定程度的门店调整和洗牌,但不一定会出现大规模的倒闭潮。
图源:豆包PC版
但从事食品软饮料行业多年的张洋(化名)称,经销商圈子中很少使用AI产品,毕竟互联网平台上的不少数据无太多参考意义。比如,头部食品软饮料财报中的业绩始终保持增长,但现实是大量产品积压在经销商仓库中。
同理,综合考虑到零食折扣店以各种理由对上游厂家退货,以检查散称食品货架饱满度为由进而提高商品周转率、对加盟商压货和强配大日期商品,软饮料行业打造大单品愈发困难之际、软饮料厂家大概率会对零食折扣店中的软饮料涨价、从而避免渠道将其打造成为引流单品等等。资本助推下的零食折扣店因步调太快,2025年下半年将有大量零食折扣店闭店,整个2025年将成为零食折扣店的生死年。
张洋的话在好想来加盟商曹阳(化名)这里得到进一步印证,曹阳表示,继2024年底好想来开业组集体降薪后今年拓展组又在裁员,为寻找出路好想来又是要求加盟商增加社群和美团渠道,又是推出升级店型。
但2024年整个零食折扣店因加密、插店、竞争激烈等问题,导致很多加盟商亏损运营,看不到回本希望。随着下半年加盟商房租到期,你觉得未来有多少加盟商会继续做赔钱买卖呢?
二、豆包TOC端如何变现?
Altman指出,Open AI上线图像生成功能后,GPT周活跃用户约在8亿-10亿,占全世界人口的1/10。作为对比,谷歌和Facebook达到10亿用户体量,分别使用13年和8年。援引《金融时报》报道,Open AI从软银和其他投资者那里累计筹资400亿美元新资金,3000亿美元的估值使其成为全球资金最充足的私营初创企业之一。
Open AI用户体量和估值激增之际,关于Open AI的质疑声音也在增加。除用户纷纷创作类似日本著名动画工作室吉卜力工作室风格的图像,导致遭遇模仿的创作家不满外。当前的Open AI仍未真正解决消费互联网公司,面临的一些最根本问题。
一是Open AI虽通过和苹果签署分销协议盈利,但全球关税战的持续博弈,让苹果诸多硬件产品直接面临成本上涨、销量下滑、元件与制造供应链搬迁可能导致的供货不顺畅等风险。这在倒逼苹果需尽快突破AI短板的同时,未来分销收入又能给Open AI带来多少利润呢?
二是Open AI到底如何从用户身上赚钱?Altman在接受外媒采访时表示,本人更倾向于通过将用户引导到电商网站来赚钱,对广告盈利嗤之以鼻。
但GPT和电商平台按照多少比例分佣?商品质量出现问题谁为用户售后?用户是否信任AI推荐的产品?GPT推荐大量商品,是否会削弱用户的信任感?换言之,AI大模型引流电商打造的全新电商形态,在全球市场仍处在空白阶段。
三是巨头控制着数字发行主要渠道时,Open AI如何才能吸引用户的长期注意力呢?比如,Meta在Whats App和Instagram等平台上拥有庞大的用户群体,苹果有各类iPhone设备。随着这些公司推广各自的全能型消费级AI,Open AI又要如何与这些巨头抗衡呢?
更现实的问题是,短期时髦的功能或能推动用户使用量达到峰值,但用户新鲜感来得快退得也快。比如,今年3月份GPT的使用时长已跌至TOP10。且随着GPT功能逐渐增多,Open AI同样需回答“用户使用GPT可以做什么”“GPT能够让用户形成的心智记忆是什么”的现实问题。
图源:AI产品榜
GPT面临的这些问题,同样是豆包未来商业化面临的问题。虽然字节有红果、抖音、今日头条等超级APP,其在抖音也上线AI搜索功能。但国内复杂的市场环境,豆包想要在TOC端走出长期正向且可持续的盈利模式,面临的难度更大。
一方面,互联网本质做的是用户使用时长+用户基数+日活的生意,这正是巨量引擎能成为国内TOP1广告平台的原因。与之而来的问题是,目前国内用户使用AI产品日均时长普遍偏低,和海外用户存在较大差异。缺乏用户使用黏性以及当前甲方纷纷收缩投放预算,未来豆包又要如何打造差异化、撒手锏AI功能呢?
图源:AI产品榜
图源:AI产品榜
另一方面,国内AI产品的同质化竞争、用户缺乏订阅习惯、电商平台大量低价会员给官网会员带来的分流、部分AI生成视频的粗制滥造、算法体系打造AI账号难度增加等问题的存在,均让AI产品靠订阅和广告带动营收仍需长期探索。高盛约瑟夫·布里格斯指出,从TOC角度来看,AI相关资本支出的真正需求仍需七年时间。
三、字节如何补齐TOB市场短板?
国内TOC AI产品盈利难得背后,或不能解释部分AI厂商或探索海外市场或走TOB路线或TOB+TOC协同发力的原因,但全球市场对AI技术的采用出现放缓。
万神殿宏观经济公司萨姆·汤姆斯指出,据美联储最近地区调查显示,服务业企业预计将削减IT和资本支出,此前几个月这些企业已经削减支出。
汤姆斯直言,大多数公司尚未找到AI用例,以ChatGPT、Gemini为代表的AI模型又都有免费版本。若你是一家中型公司的IT经理,面对当前关税博弈给企业未来发展带来的不确定性,你会愿意批准一项大型人工智能项目吗?
图源:金融时报(资本支出意向趋势以相对2015年至2024年平均值的标准差平均值表示)
先锋集团首席经济学家约瑟夫·戴维斯表示,历史上其他科技应用也曾经历过市场表现不佳、吸收率较低的时期。 这并非总是一条直线,路上总会有一些波折,每个周期中,科技行业都会在相当长的一段时间内表现不佳。市场低估新进入者,企业则质疑:既然未来我们可以选择更便宜的技术栈,为什么还要投资于这种技术栈?
更现实的问题是,当前全球AI市场出现极具割裂的一幕。一边是科技巨头每年用于AI研发支出增加,AI技术的快速发展让AI取代人类的声音从未停止。
另一边是会计文员、保险承保人、旅行社和法律秘书的日常工作和AI能力存在重叠,但美国市场这些职位的从业人员数量仍然保持在正常水平。仅有作家、程序员就业率急剧下降,远超预期,且非行业整体经济趋势所致。
图源:金融时报
割裂的背后,仍是如编程测试、论文写作的工作具有工作目标清晰、步骤可预测、任务简洁、线性、连续、流程明确的特点,这也是AI所擅长领域。作为对比,如行政助理、旅行社等工作涉及多源信息流追踪、动态环境应对、目标模糊或多变、多任务并行,人类“混乱”的工作模式超出当前AI能力范围,这也成为AI的短板。换言之,AI给不同行业、不同企业带来的降本增效价值,需具体问题具体分析。
相较美国市场,国内企业在IT费用支出上本就不高,这点从国内运行多年的SaaS产业仍困在盈利难或微薄盈利中也能侧面证实。本就困在价格战和长账期的中小企业,如今关税战的持续博弈更给很多企业和相关产业链供应链发展带来更多不确定性,这或将影响整个TOB市场对AI大模型的需求。
对字节而言,其强项是TOC,TOB大模型市场需字节长期摸索。有业内人士透露,字节刚启动大模型私有化业务,其Hi Agent类似扣子的私有化版本,豆包此前不能做私有化,专攻中台能力,从应用服务商的角度可合作广度有限。
且Hi Agent这样的中台先进入企业,当企业用不起来找应用服务商合作时,服务商自己的这部分能力就用不上。简单来说就是,先将自家产品卖出去是字节重点,但并没有考虑到体系化问题。
快进快出一直是字节多年来的内部文化,豆包在TOC和TOB商业化的长期探索,字节又是否要有足够的耐心来等待豆包商业化真正成熟的那天呢?