当前位置:首页 > 热点关注 > 正文内容

DeepSeek宣布涨价 智能体竞争加剧

2周前 (08-22)热点关注40

   8月21日,深度求索正式发布了DeepSeek-V3.1大语言模型。这款新模型最大的技术亮点是“混合推理架构”,能够在单一架构内同时支持思考模式与非思考模式热点话题。用户可以通过“深度思考”按钮实现无缝切换,在复杂任务中启用链式推理,在简单任务中快速响应。

  

   根据官方数据,DeepSeek-V3.1-Think在多项专业评测中表现突出,如AIME 2025、GPQA和LiveCodeBench等基准测试中与前代模型R1-0528性能持平,但输出token数减少20%~50%,显著降低了推理成本。在非思考模式下,模型也能以更短的输出长度保持同等性能。

  

   此次升级被视为DeepSeek在AGI竞争中的关键一步,标志着国产大模型间的竞争进入“智能体驱动”阶段。DeepSeek同步开源了V3.1的Base模型和后训练模型,参数规模达840B tokens,并在Hugging Face和魔搭社区开放下载。API方面,deepseek-chat(非思考模式)和deepseek-reasoner(思考模式)的上下文统一扩展至128K。

  

   值得注意的是,DeepSeek宣布自9月6日起调整API定价并取消夜间优惠。输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens;输出价格为12元/百万tokens。这一举措被业内解读为,深度求索将从年初的关注价格转向价值竞争的信号。此外,V3.1使用的UE8M0FP8精度是针对下一代国产芯片设计的,这可能意味着DeepSeek在硬件适配方面投入了更多资源。DeepSeek宣布涨价 智能体竞争加剧 DeepSeek宣布涨价 智能体竞争加剧

相关文章

新娘领着英国新郎回家结婚,英国女婿文质彬彬改口敬茶

新娘领着英国新郎回家结婚,英国女婿文质彬彬改口敬茶

   新娘领着英国新郎回家结婚,英国女婿文质彬彬改口敬茶。...

辽阳一饭店火灾22死3伤

   4月29日12时25分,辽宁辽阳市白塔区三里庄回迁楼附近一饭店发生火灾。截至14时,事故已造成22人死亡、3人受伤。...

欧盟将投资9.1亿欧元加强欧洲防务 提升关键防务能力

   当地时间4月30日,欧盟委员会宣布将根据2024版欧洲防务基金向国防工业投资9.1亿欧元。此次投资旨在通过欧洲科研界与工业界的协同合作,弥补部队机动性和无人机防御等关键能力方面的不足...

北科大调查董袭莹论文雷同质疑 核心内容高度重叠

北科大调查董袭莹论文雷同质疑 核心内容高度重叠

   协和医学院“4+4”博士董袭莹的博士论文因正文不足30页受到质疑。据扬子晚报报道,有人指出董袭莹2023年提交的博士论文与北京科技大学几位老师和一位研究生在2022年提交的一项发明专...

震惊!董某博士论文与北科大专利多处雷同 学术不端疑云再起!

   董某博士论文与北科大专利多处雷同    【董某博士论文与北科大专利多处雷同】近日,一则关于董某博士论文与北京科...

四川峨眉山连续两日出现日晕 蓝天白云添奇观

四川峨眉山连续两日出现日晕 蓝天白云添奇观

   连日来,四川峨眉山市蓝天白云,艳阳高照。五一假期期间,5月1日和2日,峨眉山市连续两天出现了日晕现象,给前来旅游的游客带来了惊喜。   ...