Anthropic新模型将“推理模式”与“标准模式”混合:提高数学、物理等方面的表
来源:今日头条 发表于2025-02-26 10:31:02 编辑:张易川
摘要: Anthropic周一发布名为Claude 3.7 Sonnet的模型,称这种混合型模型同时具备推理模式(停下来思考复杂答案)与标准模式(实时生成答案)的能力。 Anthropic称,Claud

  Anthropic周一发布名为Claude 3.7 Sonnet的模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与标准模式(实时生成答案)的能力。

  Anthropic称,Claude 3.7 Sonnet是市面上唯一的此类“混合”模型,并将立即投入使用。Kaplan将其比作人类大脑的运行方式:有的问题需要深度思考,有的问题需要快速作答。但Anthropic希望将这两种能力整合在同一个模型中,而不是完全分开。

  在标准模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升级版。

  在扩展思维模式下,它会在回答前进行自我反思,从而提高其在数学、物理、指令遵循、编码和许多其他任务上的表现。

  在开发推理模型时,Anthropic对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映企业实际如何使用 LLM 的现实任务。

  早期测试表明,Claude 在编码能力方面全面领先:Cursor 指出,Claude 在实际编码任务中再次名列前茅,在处理复杂代码库和高级工具使用等领域都有显著改进。Cognition 发现,在规划代码更改和处理全栈更新方面,Claude 远胜于任何其他模型。Vercel 强调了 Claude 在复杂代理工作流程中的精确度,而 Replit 已成功部署 Claude 从头开始构建复杂的 Web 应用程序和仪表板,而其他模型则停滞不前。在 Canva 的评估中,Claude 可生成具有卓越设计品味的生产就绪代码,并减少了错误。

  Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学方面提供了显著的提升。除了传统的基准测试之外,它甚至在Pokémon 《精灵宝可梦》游戏测试中超越了所有以前的模型。

  与此同时,媒体报道称,Anthropic即将完成一轮35亿美元的融资,公司估值将达到615亿美元。公司本轮融资的最初目标为20亿美元,但在谈判期间成功说服投资者增加投资。本轮融资的参与者包括Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners,总部位于阿布扎比的投资公司MGX正在洽谈参与事宜。

  在此此前,亚马逊已向Anthropic累计投资80亿美元,而谷歌母公司Alphabet已向其投资20亿美元。

投稿邮箱:qingjuedu@163.com
相关推荐
痛心!15岁女生在校坠亡,官方凌晨通报
痛心!15岁女生在校坠亡,官方凌晨通报

原标题:痛心!15岁女生在校坠亡,官方凌晨通报 2025年2月25日凌晨,江西抚州

快资讯13分钟前

奥运冠军全红婵,拟保送暨南大学!
奥运冠军全红婵,拟保送暨南大学!

原标题:奥运冠军全红婵,拟保送暨南大学! 2月24日,暨南大学公示2025年优秀

快资讯2025-02-25 19:48:28

复旦大学通报博士后抄袭论文:情节严重 作退站处理
复旦大学通报博士后抄袭论文:情节严重 作退站处理

原标题:复旦大学通报博士后抄袭论文:情节严重 作退站处理 近日,有网友发

快资讯2025-02-25 19:11:53

2025考研国家线发布!初试成绩今起可查
2025考研国家线发布!初试成绩今起可查

原标题:2025考研国家线发布!初试成绩今起可查 2025年全国硕士研究生招生考试

快资讯2025-02-24 18:24:56

100亿!《哪吒2》背后是一个“新系统”的胜利
100亿!《哪吒2》背后是一个“新系统”的胜利

原标题:100亿!《哪吒2》背后是一个新系统的胜利 100亿! 《哪吒2》到底做对

快资讯2025-02-14 19:13:38

真奇葩!收700多元作业打印费,山西太原一中学冲上热
真奇葩!收700多元作业打印费,山西太原一中学冲上热

原标题:真奇葩!收700多元作业打印费,山西太原一中学冲上热搜 在信息传播

快资讯2025-02-14 18:50:48

教师唐某某,双开,已采取刑事强制措施!
教师唐某某,双开,已采取刑事强制措施!

原标题:教师唐某某,双开,已采取刑事强制措施! 据百色融媒微信公众号消

快资讯2025-02-13 19:19:06

《哪吒2》火到国外,激活一个高校专业,动画专业择校
《哪吒2》火到国外,激活一个高校专业,动画专业择校

原标题:《哪吒2》火到国外,激活一个高校专业,动画专业择校策略 近年来,

快资讯2025-02-12 20:30:03

比起 AI,教师的“超能力”才是真正的硬通货!
比起 AI,教师的“超能力”才是真正的硬通货!

原标题:比起 AI,教师的超能力才是真正的硬通货! 人工智能来了,教师要下

快资讯2025-02-11 18:57:43

Deepseek 好用吗?深圳师生感叹:很好很强大!
Deepseek 好用吗?深圳师生感叹:很好很强大!

原标题:Deepseek 好用吗?深圳师生感叹:很好很强大! 近段时间以来,深圳不

快资讯2025-02-10 18:46:49