大模型之家2025年5月热力榜：智能体正成为通往AGI的路径

大模型之家

带您探索人工智能领域的重磅资讯、解码热点话题1小时前

2025年5月，智能体再次成为行业热议的焦点。以DeepSeek、腾讯、阿里等为代表的中国企业，正在推动智能体从概念走向实用，成为大模型产业化的重要突破口。

智能体作为具备感知、规划、执行能力的AI系统，正在从单点任务执行者演进为多智能体协作体，具备自主决策、任务分解与工具调用能力。随着多模态感知、MCP等关键技术的成熟，智能体正逐步跨越“可用”与“好用”的门槛，成为AI落地的关键路径。

在《2025年5月大模型热力榜》中，共收录了260家大型模型及其所属企业。在其中，百度、阿里、字节跳动等头部科技企业，纷纷加大在智能体领域的投入，推出多款应用产品，巩固了在榜单中的排名。DeepSeek凭借R1全新版本再次冲进榜单前列，腾讯凭借发布多款大模型以及应用产品成功进入榜单前三名。

5月，百度在AI和大模型领域多项技术突破与商业进展引发行业关注。2025Q1财报显示，智能云业务同比增速达42%，核心营收超市场预期，智能云千帆大模型平台升级后支持多模态与深度思考模型训练，接入超100个主流模型，显著降低企业AI应用门槛。萝卜快跑无人驾驶服务累计提供超1100万次出行，全球化布局加速。

21日，百度在万象AI开发者大会上发布全球首个千亿参数多模态大模型“文心·灵眸”，该模型集成视觉Transformer、语音编码器与语义理解模块，支持图像生成、视频理解等12种模态处理，并与美团合作推出智能配送大脑，使配送路径规划效率提升40%，异常订单处理时间缩短至15秒。

同期，文心大模型X1 Turbo在5月20日百度AI Day上获中国信通院最高级“4+级”评级，成为国内首款通过该测评的大模型，其在逻辑推理、代码生成等24项能力评估中16项获满分，综合性能超越DeepSeek R1等国际模型，调用成本仅为后者的25%。

不仅如此，百度旗下“通用超级智能体”心响App于5月悄然迎来了iOS端上线，与市面上以对话、写作或翻译为主的单功能AI应用不同，心响能够通过主智能体调度多个子智能体，在复杂任务处理中实现自主规划、执行与优化，“一站式”解决复杂任务。用户仅需用自然语言表达目标，系统便可自动分解需求并完成执行，不仅提升了智能体的能力边界，还大大降低了AI使用门槛。

此外，百度智能云千帆平台升级后接入超100个主流模型，调用成本行业最低，企业已通过该平台精调3.3万个模型、开发77万应用，形成“模型超市”生态。在应用落地层面，百度与昆仑芯合作的“文心一体机”集成AI加速芯片，推理延迟降至10毫秒，支持本地化部署；灵眸API平台开放30余项多模态能力，日均调用量突破10亿次，接入携程、贝壳等200余家企业。

2025年5月，阿里云飞天企业版平台通过融合智算能力，为金融、政务、能源等领域超千家头部客户提供“云+AI”协同服务，显著提升GPU利用率与任务执行效率。同期，阿里云推出百炼专属版平台，集成飞天架构与多模态数据解析能力，支持政务、医药等垂直领域快速构建智能体应用，加速AI价值释放。

在模型研发层面，阿里巴巴开源新一代混合推理模型Qwen3，性能超越Deepseek-R1、OpenAI-o1等模型，登顶全球开源模型榜单。此外，通义千问VL-Max模型优化数学推理与回复风格，并开放抢先体验。

此外，阿里云通义万相Wan2.1-VACE模型开源，成为业界功能最全的视频生成与编辑模型。AI技术深度赋能淘宝天猫广告工具、高德导航智能体、飞猪旅行AI等产品，覆盖电商、物流、文旅等多场景。

DeepSeek在技术层面，R1模型完成R1-0528版本重要升级，该版本基于DeepSeek V3 Base模型，通过追加算力投入优化后训练算法，显著提升了推理深度与思维链能力，优化代码生成、逻辑推理能力，上下文长度翻倍至128K，支持超长文本处理，数值计算精度显著提升，推理深度大幅增强，逻辑链更贴近人类思维。同时，R1-0528将幻觉率降低45-50%。此外，DeepSeek与华为昇腾集群深度适配，海外开发团队训练成本降低50%以上，并携手IBM、蓝美视讯等推动“存储+AI”解决方案落地，进一步拓展生态版图。

5月，腾讯全面加速技术迭代与产业落地：21日，腾讯云AI产业应用峰会首次全景披露大模型战略，宣布混元大模型矩阵全面升级，包括推出视觉深度推理模型混元T1 Vision和端到端语音通话模型混元Voice，并计划上线实时视频通话AI体验。

混元大模型多模态能力显著突破，上线图像生成实现“毫秒级”生图，3D生成技术凭借稀疏原生架构在可控性与超高清效果上实现代际飞跃，开源后Hugging Face下载量超160万次。

此外，腾讯云智能体开发平台同步升级，支持零代码多Agent协同与工作流模式，大幅降低企业智能体搭建门槛；知识库系列产品基于腾讯乐享和ima完成迭代，强化知识管理与应用能力。

字节跳动在火山引擎FORCE LINK AI创新巡展上发布了视觉语言多模态模型Seed1.5-VL，显著提升了视觉定位与推理能力，并新增视频理解及多模态智能体功能，进一步拓展了AI应用场景。同时，字节跳动的Seed团队开源了基于模型为中心的代码预训练数据构建流水线，并推出了Seed-Coder系列模型，推动了代码生成技术的进步。此外，字节跳动还推出了集成火山引擎豆包大模型的AI视频编辑应用“剪小影”，降低了视频创作门槛。

商汤科技多模态大模型「日日新V6」凭借62.96分的综合得分，在通用语言能力榜单上与豆包1.5并列国内第一；在OpenCompass多模态测评中更以80.4分超越Gemini 2.5 Pro，登顶全球。依托多模态长思维链、全局记忆等技术，日日新V6在处理文本、图像、视频等复杂任务时展现出极高效率与低推理成本，已落地至具身智能、智慧教育等多个场景。

在行业生态上，商汤加速“模型+应用”一体化：与广汽联合量产落地辅助驾驶方案，与听力熊共推教育AI助手，并联合麒麟软件打造国产办公AI一体机，为政企客户提供全栈式支持。面向开发者，商汤开源低代码框架LazyLLM，十行代码即可构建多Agent应用，其API性能排名全行业首位。

算力基建方面，SenseCore2.0大装置算力规模达到2.3万PetaFlops，全面支持大模型效率跃升。与声网合作也将日日新嵌入音视频服务，赋能智能面试等场景，2024年生成式AI业务收入同比翻倍，商汤正逐步从“技术领先”走向“生态主导”。

360在AI和大模型领域动作频频，展现出其在安全、技术落地与生态合作方面的多重布局。360纳米AI连续3个月登顶国内AI产品增速榜，成为全球AI搜索引擎三强，其升级版“纳米AI超级搜索”实现跨平台搜索、多模态生成及闭环任务执行，最新版本强化“AI搜索”“智能体”等模块的对话体验。360集团创始人周鸿祎在公开演讲中强调，2025年将是智能体爆发之年，大模型需进化为智能体以实现具体任务执行，360正通过智能体构建、生态协作与硬件融合，加速AI技术普惠与应用深化。

生态合作方面，360与智谱AI达成战略合作，共研千亿级大模型“360GLM”，形成“双引擎”驱动布局，并推动大模型技术开源与场景化落地。

5月，科大讯飞在AI与大模型领域持续深耕教育场景并加速全球化布局。在武汉举办的2025世界数字教育大会上，科大讯飞展示了基于星火X1深度推理大模型的创新成果，包括支持3D立体图形智能识别的AI黑板、具备跨时空资源匹配功能的“奇思妙问”竖屏，并联合中国教科院正式启动中小学科学教育智能导师项目，旨在通过构建“教学思维链”驱动的专用模型，实现智能辅教与个性化导学。

同期，科大讯飞公布其智慧教育业务已覆盖全国32个省级行政区、超5万所学校的1.3亿师生，2024年相关营收达72.29亿元，同比增长29.94%。此外，继4月支持日本大阪世博会中国馆后，科大讯飞5月持续推广“AI孙悟空”多语种智慧导览系统，该系统基于星火大模型实现中、日、英三语交互，成为国产AI技术出海的重要标杆。

5月7日，阶跃星辰与ACE Studio联合发布并开源音乐大模型ACE-Step（中文名：音跃），支持LoRA和ControlNet等多种微调方式，可灵活适配音频编辑、人声合成、伴奏生成、声线克隆及风格迁移等下游任务。该模型通过降低音乐AI应用的开发门槛，为创作者和开发者提供更便捷的工具支持。

科技举报

大模型之家

带您探索人工智能领域的重磅资讯、解码热点话题 |

260篇文章 | 9人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

大模型之家2025年5月热力榜：智能体正成为通往AGI的路径

大模型之家

大模型之家

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

风闻“投资者保护”：守护你的财富，共筑理性投资路

最近更新的专栏

风闻最热

全部专栏