0成本一键开播,数字人迎来应用爆发
来源 | Tech星球
文 | 王琳
24小时不眠不休,季度GMV超过50万,拉动订单量增长超10倍——这不是科幻片,而是百度优选主播东北翠花的真实战绩。更重要的是,翠花并没有额外投入更多的成本,反而使得直播成本大幅度降低。
这其中百度慧播星数字人起了关键作用——只需要上传一段3分钟左右的视频,最快3小时,便可以生成自己的数字人直播间。更重要的是,这种“高说服力”数字人,其声形超拟真、内容更专业、互动更灵活,实现了数字人超越真人的体验。
过去,一个数字人的制造成本从几万到几百万不等,因为成本较高,关于大模型应用如何落地的争论从未停止。但现在,模型能力的进步让数字人的成本下降到了百元、千元级别甚至免费,周期也指数级缩短,效果也更好。
技术的大规模下降正在重构产业认知。4月25日,百度创始人李彦宏在Create大会表示,AI数字人是2025年最令人激动的突破性应用之一。因为,任何一个时代,创新的本质都来源于技术平权。而当AI生产力成本趋近于零,任何个体都能拥有自己的数字分身,数字人进入千行百业,注定引爆百万级应用场景的革命。
0成本开播,人人可享的数字人
号称业界首个AI全栈式数字人解决方案的慧播星最近上线了一个新功能:一键开播,在官方的介绍里,仅凭一部手机,只需要上传一段2分钟的真人出镜视频,最短3个小时,普通人就可以完成数字人开播。
按照官方的指引,我们打开了百度APP,搜索“慧播星”,点击“手机端一键开播”、“创建数字人”变来到了产品首页,如下图。
Tech星球首先录制了一段3分20秒的视频,我们并没有准备诸如打光灯、手机支架类的任何设备,只是用了一部手机,在视频的录制过程中,全程露脸。之后,在等待视频上传的同时,我们就可以选择自己的人设和主题、以及直播脚本。
慧播星准备了4个人设,包含情感咨询、读书分享、健康咨询、国学风水,比如,随机选择读书分享,AI就自动帮我们生成了一份人设指南以及直播主题,甚至连直播脚本都写好了。如果有需要,你还可以自由设定自己的专属人设。
为了测试慧播星的真实水平,我们并没有选择这些预备好的人设,而是决定自定义,毕竟随机出题,更能体现AI的能力。我们给自己定义的人设是,塑身爱好者,尤其擅长解决办公室久坐造成的各种体态、体型问题。
至于直播脚本,我们选择用“AI帮我写”,整个脚本生成过程不到2分钟,但却针对办公室常见的乌龟颈、扁平臀、大腿粗都有涉及,并给出了解决方案。
这样一套流程操作下来,就可以静静等待专属数字人分身开播了。在整个直播制作过程中,无须全程紧盯,制作好会短信通知,页面也会提示一个大概的开播时间。
市面的数字人神情呆板、动作木讷、机器音重的并不在少数,因此我们对慧播星的期待值并没有很高。但3小时43分钟后,我们的数字人直播间制作完成,它的表现大大超出了我们的预期。
首先,慧播星数字人的表情、语气、动作都非常真实,嘴唇弧度完全接近真人、甚至发型的轮廓清晰到可以看到额前飘过的几根碎发。在直播过程中,随着身体的晃动,头发也会随之自然摆动。
市面上很多数字人在做动作时,往往不符合人类逻辑。比如直播过程中眼镜下滑,很多数字人并绕一大圈去扶眼镜,而是慧播星可以像人类一样,直接找到镜腿,过程中动作丝毫不僵硬。再比如很多主播去拨头发时,一些数字人会在头发附近随便绕一圈,但慧播星生成的数字人手指会沿着鬓角,全程触摸到头发,按照一定的弧度完成拨头发的动作,非常符合人类行为逻辑。
图注:左侧为真人,右侧为数字人。
不同于传统数字人全程语气毫无变化的念脚本,在直播时,慧播星数字人能够根据脚本内容的含义和语境,自动调整说话的语气和强调。同时,数字人的面部表情和口唇也会做出相应变化,符合观众的感知经验。比如当说到“娓娓道来”几个字时,真人主播嘴唇会轻微翘起,且稍微皱一下眉头,而数字人主播也会出现这种完全符合真人行为的微表情变化。
慧播星生成的数字人不仅仅是像真人,它的直播间的互动表现甚至比真人还要好。在直播过程中,有观众进来提问,数字人会自然地打招呼,并一种充满热情地语调表示“欢迎XX来到直播间”。更重要的是,它会及时回答问题,而且互动有趣。比如,有观众问,如何让大腿根变瘦。主播会表示自己曾经也有这样的困扰,回答完后,还会提醒观众继续提问。
这样一套流程下来,即便你从未有过直播经验,没有动辄上万的专业设备,完全可以在不花一分钱的情况下,开启自己的直播首秀,并且它的效果完全不亚于,甚至超越真人。对于中小企业而言,慧播星让他们彻底甩开了成本负担,可以放开手脚去探索更多业务。
慧播星的出现,让数字人不再是实验室里高高在上的技术,企业发布会的空头支票,而是切切实实让技术普惠到每一个普通人,数字人也真正迎来了属于自己的DeepSeek时刻。
技术平权背后,大模型让数字人“降本增效”
在大模型出现以前,数字人技术经历了从建模、绑定、渲染到语音交互、自然语音处理、视觉技术等多次迭代,但他们都未能大规模降低数字人的成本和周期。制作一个数字人往往需要几万元甚至数百万元,周期以月为单位,并且效果欠佳。
大模型技术的进步彻底改变了这一叙事。以百度慧播星为例子,其数字人的成本已经是去年的三分之一,并且效果更好。
数字人主播得以更专业的前提之一,便是以DeepSeek R1、文心4.5、X1等大语言模型的能力大幅度提高,这让数字人的脚本能力得以大幅度提升。现在,AI完全可以根据直播间的人设来完成不同风格的脚本,比如一个医生需要专业且谨慎,一个电商主播可以引经据典介绍商品。
这很大程度上解决了,真人主播受限于文化水平、语言表达能力,直播讲解商品时参差不齐的情况。
但这还不足以让数字人超越真人主播,毕竟真人直播间最重要的是,主播的语气、动作、临场反应,这也是实现高说服力的关键突破点。
此次慧播星数字人非常重要的一次迭代便是由脚本模式升级为剧本模式。在该模式下,数字人主播可以根据剧本内容实时调整语调、表情和动作,比如讲解《钢铁是怎么炼成的》可以激情澎湃,讲到关键情节时,可以“挥舞拳头”表达主人公的情绪;讲《我的阿勒泰》可以像作者一样娓娓道来,这些不同的情感,都可以通过剧本模式,根据语言情境生成,并且可以做到情绪转折、动作切换顺畅。
这还不够。一个真实的直播间,除了主播,往往还有助播、场控、运营等角色打配合。为此,慧播星给数字人配备了一个可以自主决策的AI大脑,它可以像人一样具备感知和决策的能力。
在现实的直播情境下,直播间内往往会出现多个用户对同一个商品感兴趣,要求主播快点讲解的情况。数字人收到信号后,就会调度视频来呈现用户想要看到的商品讲解画面,跟用户实时互动讲解商品。
当讲解完后,数字人发现用户的购买热情很高,便会调动营销专家来发红包,给出一定的优惠政策,同时调动助播专家调节气氛,以此完成商品的最大转化。这里的每个专家都不是真人,它们是一个一个Agent,只需要一个调度,直播间便可以实现多个Agent的协同,实现毫秒级的响应。从这个角度讲,一个数字人可以同时干至少3个人的活,其直播水平已经超越了真人直播间。
在此前今年3月,百度就曾面向商家客户推出了“一键克隆”功能,只需上传一段直播回放录屏或一段真人出镜短视频,即可生成与真人无异的数字人分身,声音形象和直播间装修都可以准备好,实现了开播零门槛。
更重要的是,凭借自研多模态算法,慧播星攻克了360度大角度侧转、遮挡以及手持等数行业难题,借此服饰主播可以手持商品,通过大角度侧转、大幅度动作,让观众看清每一个细节,提高转化率。
百度慧播星数字人的表现也获得了IDC的高度评价。近期发布的《中国AI Agent之电商直播数字人实测,2Q25》报告显示,百度慧播星综合实力排名行业第一,五项测评指标中,百度慧播星在技术能力、产品表现、平台合规与稳定性、客户服务四项均位列第一。
这一套组合拳下来,过去一年,慧播星数字人主播数量累计超过10 万,其展现出来的高说服力也带来了显著的收益,大盘来看数字人直播转化率提升了31%,降低了80%的开播成本。
当数字人开始接管商业世界
今年4月,李彦宏在百度25周年的全员信中明确指出,大模型赋能的AI原生应用将在2025年继续井喷式增长。
在Tech星球看来,AI原生应用爆发的前提需要满足三个条件:落地成本大幅下降、产品能力和效果显著提升,且场景多元。4月25日,Create2025百度AI开发者大会的高说服力数字人恰好完全满足,其实绩也非常抗打。
今年春节期间,数字人让主播们放了个好假,但同时商家却并没有因此业绩下滑。据Tech星球不完全统计,今年百度优选年货节期间,苏宁易购超级买有10场直播,其中5场直播超过18个小时,有些甚至达到了24小时,这些直播里,几乎全部由数字人主导,他们贡献了远超真人直播的业绩,数据显示年货节期间,该直播间GMV突破了300万,订单量同比提升了50倍。
销售额大幅提升的同时,企业并没有额外支出更多成本,甚至因为用了数字人,成本还下降了。企业对数字人的态度也从此前的观望逐渐转向拥抱,他们有了底气探索更多的赛道,公司的天花板也更高了。
数字人也正在从电商场景拓展开来。在百度上,用户可以看到主攻孩子抑郁、厌学等情绪的观心实验室;提供旅游服务的轻松游旅行等都在使用数字人直播。未来景区里既可以讲解历史,又能直播带货的数字人AI导游;孤独经济下的AI陪伴直播等等,数字人未来完全有可能渗透到人类生活中的方方面面。
这并非个例,而是技术发展的必然。a16z 发布 AI Avatar 数字人的最新报告,报告预测:现在底层模型的技术水平已经显著提升,能够生成质量较高、观看体验较好的 AI 虚拟形象,因此可以肯定地说,应用层面将迎来快速发展的机遇,预计该领域将孕育出多个价值数十亿美元的公司。
现在来看,数字人应用的爆发已跨越技术验证期,正迈入规模化落地的新临界点。2025年,数字人将像水电一样渗透生活,极低的成本和不输真人的效果很有可能让它成为企业尝试拥抱大模型和应用大模型最好的入口之一。这不是未来,而是正在发生的现实。