2026-04-17 01:56来源:本站

【编者按】在AI模型迭代如潮的当下,Anthropic再次以四个月为周期,准时推出全新升级版Sonnet 4.6。这次更新不仅将上下文窗口一举扩大至百万令牌,足以容纳整个代码库或数十篇研究论文,更在编码、指令遵循与计算机使用等核心能力上实现显著突破。尤其引人注目的是,其在针对人类智能特质的ARC-AGI-2测试中取得60.4%的高分,虽仍稍逊于顶尖模型,却已超越多数同级产品。随着Opus 4.6上线仅两周后便快速跟进,Anthropic正以密集节奏推动AI边界,这场智能竞赛的下一章,或许已悄然翻开。
Anthropic发布了其中等规模Sonnet模型的新版本,延续了该公司四个月一次的更新节奏。在宣布新模型的文章中,Anthropic重点强调了其在编码、指令遵循和计算机使用方面的改进。
Sonnet 4.6将成为免费版和Pro版用户的默认模型。
Sonnet 4.6的测试版将包含100万令牌的上下文窗口,是此前Sonnet最大窗口尺寸的两倍。Anthropic将这一新上下文窗口描述为“足以在单次请求中容纳整个代码库、长篇合同或数十篇研究论文”。
此次发布仅在Opus 4.6推出两周后,而更新版的Haiku模型预计将在未来几周内跟进。
伴随此次发布,Sonnet 4.6还创下了一系列新的基准测试纪录,包括针对计算机使用的OS World和针对软件工程的SWE-Bench。但最令人印象深刻的或许是其在ARC-AGI-2测试中取得的60.4%分数,该测试旨在衡量人类智能特有的能力。这一分数使Sonnet 4.6超越了大多数同类模型,尽管它仍落后于Opus 4.6、Gemini 3 Deep Think以及GPT 5.2的某个精调版本。