当前位置:首页 > 热点关注 > 正文内容

DeepSeek宣布涨价 智能体竞争加剧

1周前 (08-22)热点关注34

   8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式热点话题。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  

   根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。

  

   此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。

  

   值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。DeepSeek宣布涨价 智能体竞争加剧 DeepSeek宣布涨价 智能体竞争加剧

相关文章

《今日关注》 20250429 普京宣布将停火72小时 特朗普称乌总统继续要武器

   本期节目主要内容: 俄总统普京宣布5月8日零时至11日零时实施停火,白宫称特朗普希望俄乌之间实现“永久停火”。泽连斯基承认乌情报部门刺杀俄高官,行动细节曝光。白宫争吵后首次碰面,美乌...

应急管理部工作组赴太原小区爆炸现场 指导救援与排查

   4月30日13时许,山西省太原市小店区丰景佳园小区发生爆炸,造成人员伤亡。应急管理部立即视频调度现场处置工作,派出工作组赴现场指导救援,要求全力扑火、逐楼逐层排查,抓紧核清被困人员数...

戈贝尔爆砍27分24篮板 创生涯季后赛新高

戈贝尔爆砍27分24篮板 创生涯季后赛新高

   北京时间5月1日,NBA季后赛中,森林狼以103-96战胜湖人,系列赛总比分4-1淘汰对手。比赛中,戈贝尔在禁区内表现出色,出场39分钟,投篮15次命中2球,罚球6中3,贡献了27分...

五一假期哪些地方是打卡榜C位 一线城市与乡村游热度飙升

五一假期哪些地方是打卡榜C位 一线城市与乡村游热度飙升

   通过大数据分析,今年五一假期的出游热度从4月22日开始逐渐升温,并在5月1日达到高峰。预计出游人群规模将比去年增加8%。   ...

苹果Q2服务业务收入略低于预期 增速放缓引担忧

   苹果在周四美股收盘后公布了2025财年第二财季财报,截至3月底。财报显示,苹果的营收和净利润均超出市场预期,但服务业务增长疲软,导致盘后股价下跌超过2%。    具...

登陆少年演唱会内场 检票指南公布

   2025年TOP登陆少年组合·无所畏计划·演唱会将在晋江第二体育中心主体育馆举办,相关检票指南已经公布。    观演人需携带与购票时提供的对应观演人有效证件一致的身...