大模型之家2025年5月热力榜:智能体正成为通往AGI的路径

500

2025年5月,智能体再次成为行业热议的焦点。以DeepSeek、腾讯、阿里等为代表的中国企业,正在推动智能体从概念走向实用,成为大模型产业化的重要突破口。

智能体作为具备感知、规划、执行能力的AI系统,正在从单点任务执行者演进为多智能体协作体,具备自主决策、任务分解与工具调用能力。随着多模态感知、MCP等关键技术的成熟,智能体正逐步跨越“可用”与“好用”的门槛,成为AI落地的关键路径。

在《2025年5月大模型热力榜》中,共收录了260家大型模型及其所属企业。在其中,百度、阿里、字节跳动等头部科技企业,纷纷加大在智能体领域的投入,推出多款应用产品,巩固了在榜单中的排名。DeepSeek凭借R1全新版本再次冲进榜单前列,腾讯凭借发布多款大模型以及应用产品成功进入榜单前三名。

500

5月,百度在AI和大模型领域多项技术突破与商业进展引发行业关注。2025Q1财报显示,智能云业务同比增速达42%,核心营收超市场预期,智能云千帆大模型平台升级后支持多模态与深度思考模型训练,接入超100个主流模型,显著降低企业AI应用门槛。萝卜快跑无人驾驶服务累计提供超1100万次出行,全球化布局加速。

21日,百度在万象AI开发者大会上发布全球首个千亿参数多模态大模型“文心·灵眸”,该模型集成视觉Transformer、语音编码器与语义理解模块,支持图像生成、视频理解等12种模态处理,并与美团合作推出智能配送大脑,使配送路径规划效率提升40%,异常订单处理时间缩短至15秒。

同期,文心大模型X1 Turbo在5月20日百度AI Day上获中国信通院最高级“4+级”评级,成为国内首款通过该测评的大模型,其在逻辑推理、代码生成等24项能力评估中16项获满分,综合性能超越DeepSeek R1等国际模型,调用成本仅为后者的25%。

不仅如此,百度旗下“通用超级智能体”心响App于5月悄然迎来了iOS端上线,与市面上以对话、写作或翻译为主的单功能AI应用不同,心响能够通过主智能体调度多个子智能体,在复杂任务处理中实现自主规划、执行与优化,“一站式”解决复杂任务。用户仅需用自然语言表达目标,系统便可自动分解需求并完成执行,不仅提升了智能体的能力边界,还大大降低了AI使用门槛。

此外,百度智能云千帆平台升级后接入超100个主流模型,调用成本行业最低,企业已通过该平台精调3.3万个模型、开发77万应用,形成“模型超市”生态。在应用落地层面,百度与昆仑芯合作的“文心一体机”集成AI加速芯片,推理延迟降至10毫秒,支持本地化部署;灵眸API平台开放30余项多模态能力,日均调用量突破10亿次,接入携程、贝壳等200余家企业。

2025年5月,阿里云飞天企业版平台通过融合智算能力,为金融、政务、能源等领域超千家头部客户提供“云+AI”协同服务,显著提升GPU利用率与任务执行效率。同期,阿里云推出百炼专属版平台,集成飞天架构与多模态数据解析能力,支持政务、医药等垂直领域快速构建智能体应用,加速AI价值释放。

在模型研发层面,阿里巴巴开源新一代混合推理模型Qwen3,性能超越Deepseek-R1、OpenAI-o1等模型,登顶全球开源模型榜单。此外,通义千问VL-Max模型优化数学推理与回复风格,并开放抢先体验。

此外,阿里云通义万相Wan2.1-VACE模型开源,成为业界功能最全的视频生成与编辑模型。AI技术深度赋能淘宝天猫广告工具、高德导航智能体、飞猪旅行AI等产品,覆盖电商、物流、文旅等多场景。

DeepSeek在技术层面,R1模型完成R1-0528版本重要升级,该版本基于DeepSeek V3 Base模型,通过追加算力投入优化后训练算法,显著提升了推理深度与思维链能力,优化代码生成、逻辑推理能力,上下文长度翻倍至128K,支持超长文本处理,数值计算精度显著提升,推理深度大幅增强,逻辑链更贴近人类思维。同时,R1-0528将幻觉率降低45-50%。此外,DeepSeek与华为昇腾集群深度适配,海外开发团队训练成本降低50%以上,并携手IBM、蓝美视讯等推动“存储+AI”解决方案落地,进一步拓展生态版图。

5月,腾讯全面加速技术迭代与产业落地:21日,腾讯云AI产业应用峰会首次全景披露大模型战略,宣布混元大模型矩阵全面升级,包括推出视觉深度推理模型混元T1 Vision和端到端语音通话模型混元Voice,并计划上线实时视频通话AI体验。

混元大模型多模态能力显著突破,上线图像生成实现“毫秒级”生图,3D生成技术凭借稀疏原生架构在可控性与超高清效果上实现代际飞跃,开源后Hugging Face下载量超160万次。

此外,腾讯云智能体开发平台同步升级,支持零代码多Agent协同与工作流模式,大幅降低企业智能体搭建门槛;知识库系列产品基于腾讯乐享和ima完成迭代,强化知识管理与应用能力。

字节跳动在火山引擎FORCE LINK AI创新巡展上发布了视觉语言多模态模型Seed1.5-VL,显著提升了视觉定位与推理能力,并新增视频理解及多模态智能体功能,进一步拓展了AI应用场景。同时,字节跳动的Seed团队开源了基于模型为中心的代码预训练数据构建流水线,并推出了Seed-Coder系列模型,推动了代码生成技术的进步。此外,字节跳动还推出了集成火山引擎豆包大模型的AI视频编辑应用“剪小影”,降低了视频创作门槛。

商汤科技多模态大模型「日日新V6」凭借62.96分的综合得分,在通用语言能力榜单上与豆包1.5并列国内第一;在OpenCompass多模态测评中更以80.4分超越Gemini 2.5 Pro,登顶全球。依托多模态长思维链、全局记忆等技术,日日新V6在处理文本、图像、视频等复杂任务时展现出极高效率与低推理成本,已落地至具身智能、智慧教育等多个场景。

在行业生态上,商汤加速“模型+应用”一体化:与广汽联合量产落地辅助驾驶方案,与听力熊共推教育AI助手,并联合麒麟软件打造国产办公AI一体机,为政企客户提供全栈式支持。面向开发者,商汤开源低代码框架LazyLLM,十行代码即可构建多Agent应用,其API性能排名全行业首位。

算力基建方面,SenseCore2.0大装置算力规模达到2.3万PetaFlops,全面支持大模型效率跃升。与声网合作也将日日新嵌入音视频服务,赋能智能面试等场景,2024年生成式AI业务收入同比翻倍,商汤正逐步从“技术领先”走向“生态主导”。

360在AI和大模型领域动作频频,展现出其在安全、技术落地与生态合作方面的多重布局。360纳米AI连续3个月登顶国内AI产品增速榜,成为全球AI搜索引擎三强,其升级版“纳米AI超级搜索”实现跨平台搜索、多模态生成及闭环任务执行,最新版本强化“AI搜索”“智能体”等模块的对话体验。360集团创始人周鸿祎在公开演讲中强调,2025年将是智能体爆发之年,大模型需进化为智能体以实现具体任务执行,360正通过智能体构建、生态协作与硬件融合,加速AI技术普惠与应用深化。

生态合作方面,360与智谱AI达成战略合作,共研千亿级大模型“360GLM”,形成“双引擎”驱动布局,并推动大模型技术开源与场景化落地。

5月,科大讯飞在AI与大模型领域持续深耕教育场景并加速全球化布局。在武汉举办的2025世界数字教育大会上,科大讯飞展示了基于星火X1深度推理大模型的创新成果,包括支持3D立体图形智能识别的AI黑板、具备跨时空资源匹配功能的“奇思妙问”竖屏,并联合中国教科院正式启动中小学科学教育智能导师项目,旨在通过构建“教学思维链”驱动的专用模型,实现智能辅教与个性化导学。

同期,科大讯飞公布其智慧教育业务已覆盖全国32个省级行政区、超5万所学校的1.3亿师生,2024年相关营收达72.29亿元,同比增长29.94%。此外,继4月支持日本大阪世博会中国馆后,科大讯飞5月持续推广“AI孙悟空”多语种智慧导览系统,该系统基于星火大模型实现中、日、英三语交互,成为国产AI技术出海的重要标杆。

5月7日,阶跃星辰与ACE Studio联合发布并开源音乐大模型ACE-Step(中文名:音跃),支持LoRA和ControlNet等多种微调方式,可灵活适配音频编辑、人声合成、伴奏生成、声线克隆及风格迁移等下游任务。该模型通过降低音乐AI应用的开发门槛,为创作者和开发者提供更便捷的工具支持。

站务

全部专栏