今年早些时候,DeepSeek 在科技行业掀起了一阵不小的波澜。尽管 DeepSeek 只是一家名不见经传的中国初创公司,但它发布了免费开源推理模型 R1,其性能与 OpenAI、Anthropic 和谷歌等主要人工智能公司的领先模型不相上下。

DeepSeek 发布经过重大改进的 R1 推理模型更新版

除了开源和高性能之外,DeepSeek 还通过使用更少的资源进行训练,表现出了非凡的效率。这是通过多种技术实现的,包括精炼的专家混合(MoE)架构、先进的压缩方法、多标记预测能力以及强化学习优先的训练方法。

今天,DeepSeek 发布了 R1 模型的首次重大更新 DeepSeek-R1-0528。更新后的模型及其权重已在 Hugging Face 上发布。尽管 DeepSeek 尚未发布官方基准测试结果,但一些人工智能爱好者和开发者已经开始分享测试结果--这些结果似乎令人印象深刻。

根据评估大型语言模型编码能力的基准测试 LiveCodeBench,DeepSeek-R1-0528 现在排名第 4,超过了 o4 Mini(低)、Grok-3-mini(高)和 Gemini 2.5 Flash Preview 等模型。

传骁龙 8 Elite Gen 2 和天玑 9500 单核性能将媲美或超越苹果的 M4

DeepSeek 发布经过重大改进的 R1 推理模型更新版

此外,@Chetasula 在海外社交平台上报告说,最新的 DeepSeek R1 更新现在可以进行深度推理,类似于谷歌的模型,并且可以根据任务 “思考 ”长达 30-60 分钟。

DeepSeek 发布经过重大改进的 R1 推理模型更新版

有兴趣试用最新 R1 更新的用户,可在 OpenRouter 或 LMArena 下载。

苹果正在降低 MacBook Pro 扬声器的维修