DeepSeek 发布经过重大改进的 R1 推理模型更新版

今年早些时候，DeepSeek 在科技行业掀起了一阵不小的波澜。尽管 DeepSeek 只是一家名不见经传的中国初创公司，但它发布了免费开源推理模型 R1，其性能与 OpenAI、Anthropic 和谷歌等主要人工智能公司的领先模型不相上下。

除了开源和高性能之外，DeepSeek 还通过使用更少的资源进行训练，表现出了非凡的效率。这是通过多种技术实现的，包括精炼的专家混合（MoE）架构、先进的压缩方法、多标记预测能力以及强化学习优先的训练方法。

今天，DeepSeek 发布了 R1 模型的首次重大更新 DeepSeek-R1-0528。更新后的模型及其权重已在 Hugging Face 上发布。尽管 DeepSeek 尚未发布官方基准测试结果，但一些人工智能爱好者和开发者已经开始分享测试结果--这些结果似乎令人印象深刻。

根据评估大型语言模型编码能力的基准测试 LiveCodeBench，DeepSeek-R1-0528 现在排名第 4，超过了 o4 Mini（低）、Grok-3-mini（高）和 Gemini 2.5 Flash Preview 等模型。

传骁龙 8 Elite Gen 2 和天玑 9500 单核性能将媲美或超越苹果的 M4

DeepSeek 发布经过重大改进的 R1 推理模型更新版

此外，@Chetasula 在海外社交平台上报告说，最新的 DeepSeek R1 更新现在可以进行深度推理，类似于谷歌的模型，并且可以根据任务 “思考 ”长达 30-60 分钟。

DeepSeek 发布经过重大改进的 R1 推理模型更新版

有兴趣试用最新 R1 更新的用户，可在 OpenRouter 或 LMArena 下载。

苹果正在降低 MacBook Pro 扬声器的维修

评论功能已关闭