当前位置:首页 > 热点关注 > 正文内容

DeepSeek-V3.1正式发布 新版本效率大幅提升

1周前 (08-22)热点关注30

   DeepSeek用户期待的R2模型尚未到来,但V3.1版本已经发布。8月21日,DeepSeek官方公众号宣布最新大语言模型DeepSeek-V3.1正式上线,距离上一个版本DeepSeek-V3-0324已有五个月。

  

   新版本在三个方面进行了升级:混合推理架构、更高的思考效率以及更强的Agent能力。从命名来看热点话题,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。该模型支持两种工作模式——思考模式和非思考模式。面对简单问题时,它以非思考模式快速作答;处理复杂问题时,则切换到思考模式,提供更具深度和逻辑的答案。用户可以通过官方App或网页端的“深度思考”按钮来切换这两种模式。

  

   与之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短时间内给出答案,并且经过思维链压缩训练后热点话题,token消耗量减少了20%至50%,同时保持了与R1-0528相当的任务表现。此外,在非思考模式下,新模型的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的性能。

   通过Post-Training优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1的表现显著优于以往模型。社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了多个知名模型,完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

   随着V3.1的发布,DeepSeek调整了API接口调用价格,并取消了夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens;输出价格调整为12元/百万tokens。DeepSeek还在评论区提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。UE8M0 FP8是针对即将发布的下一代国产芯片设计的。DeepSeek-V3.1正式发布 新版本效率大幅提升 DeepSeek-V3.1正式发布 新版本效率大幅提升

相关文章

《健康之路》 20250430 厨房除菌大作战(下)

   本期节目主要内容:不恰当的泡发方式易滋生大量致病细菌,剩菜直接放冰箱也容易受污染,专家教你正确的食物泡发方法,合理处理剩菜剩饭,守护饮食安全。(《健康之路》 20250430 厨房除...

陕西交警精准拦截一非法营运车辆 专项整治行动展开

陕西交警精准拦截一非法营运车辆 专项整治行动展开

   4月29日下午3点,西安市公安交警在长乐门城墙下开展了针对两三轮车无牌无证、闯灯逆行、非法载客等重点交通违法行为的专项整治行动。随着“五一”黄金周临近,为进一步规范路面交通秩序,全力...

《哪吒2》4月再登月票房冠军 连续四次夺冠

《哪吒2》4月再登月票房冠军 连续四次夺冠

   4月全国电影总票房达到11.92亿,《哪吒之魔童闹海》再次成为月票房冠军。该片已连续四个月占据榜首位置。   ...

《百家讲坛》 20250430 食物的历史(第一部) 6 甜蜜的大麦

   本期节目主要内容:大麦,作为人类最早驯化的农作物之一,始终贯穿中华文明的发展脉络。从关中平原的麦饭,到江南甜蜜的麦芽糖,再到雪域高原上的青稞糌粑,这株金色作物,不仅绘制了地域饮食图谱...

《探索·发现》 20250501 车八岭的动物世界(1)

   本期节目主要内容:逶迤连绵的南岭山脉东段,有一处鲜为人知的秘境,名字叫做车八岭。这片无边的山林之下,是一个规模庞大、品类繁盛的物种王国,其中的动物更是极富特色。(《探索·发现》 20...

日本皇室生活费被内鬼偷了 侍从盗走360万日元

   日本宫内厅证实,德仁天皇的一名侍从自2023年11月起多次盗窃用于皇室生活开支的“内廷费”,涉案金额合计360万日元(约合18.1万元人民币)。这名现年20多岁的侍从于日前被移交警方...