英伟达发布Llama-Nemotron系列新模型，性能超越DeepSeek-R1

近屿智能_

6分钟前

近期，英伟达重磅推出开源模型系列 Llama-Nemotron，以强悍的推理能力与高效性能引发广泛关注，被认为可能重新定义开源AI的技术格局。

500

该系列模型在推理速度上全面超越DeepSeek-R1，内存使用效率与吞吐表现也大幅提升。其训练策略融合合成数据的监督微调与强化学习方式，多维提升模型在复杂任务下的推理表现。系列包括LN-Nano8B、LN-Super49B与LN-Ultra253B三个梯度版本，覆盖从轻量部署到高性能算力场景。其中，旗舰型号LN-Ultra支持128K长上下文，可在单个8xH100节点高效运行，特别适合处理长文本与多步骤任务。

500

Llama-Nemotron系列创新地引入“推理开关”机制，用户只需使用“detailed thinking on/off”提示词，即可在日常交互与高阶推理之间自由切换。模型训练路径涵盖神经架构搜索、知识蒸馏、预训练修复、监督微调及数学/科学数据集上的强化学习等阶段，尤其在STEM领域显示出领先优势。结合Puzzle框架进行硬件自适应优化，进一步强化推理效率。

这一系列模型的发布，为开源AI社区注入新活力，展示了英伟达在通用推理与大模型优化方向的技术积淀。

科技举报

近屿智能_

13篇文章 | 0人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

英伟达发布Llama-Nemotron系列新模型，性能超越DeepSeek-R1

近屿智能_

近屿智能_

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

书香跨界，探索多元——世界读书日特别活动推荐书单公布啦~

最近更新的专栏

风闻最热

全部专栏