Claude 3.5 Sonnet升级版来袭,AI编程能力再创新高,国内可用!

重磅! Claude 3.5 Sonnet升级版来袭,国内可用!

夜幕降临,时针指向十一点。大洋彼岸,晨光初现,恰逢早上八点整。

Claude携带重磅更新,闪耀登场。

Claude 3.5 Sonnet升级版宣传图
Claude 3.5 Sonnet升级版宣传图

此次更新带来了三大亮点:升级版Claude 3.5 Sonnet、全新模型Claude 3.5 Haiku,以及令人瞩目的新功能——"计算机操控"(Computer Use)。

Claude 3.5 Sonnet:升级版重磅来袭

Claude一直以来维持三个尺寸的模型体系:Opus、Sonnet和Haiku,按规模由大到小排列。

今年3月,Claude正式推出了第三代全系列模型。而在6月,他们又推出了Claude 3.5 Sonnet,这是一次单独的升级,没有同步更新3.5版本的Opus和Haiku。当时,Claude 3.5 Sonnet的能力就已经远超旧版最大参数模型。

如今,我们迎来了升级版Claude 3.5 Sonnet,以及全新的Claude 3.5 Haiku。

Claude 3.5 Sonnet和Haiku模型对比图
Claude 3.5 Sonnet和Haiku模型对比图

有趣的是,Claude 3.5 Haiku是后期训练的产物,其知识截止时间为7月。而升级版Claude 3.5 Sonnet的知识时间并未改变,这意味着它主要通过增加强化学习的合成数据以及"计算机控制"的训练来提升性能。

在整体性能方面,Claude 3.5 Sonnet可谓傲视群雄。

Claude 3.5 Sonnet性能评分图表
Claude 3.5 Sonnet性能评分图表

无论是推理能力、本科知识储备还是编程技能,Claude 3.5 Sonnet都位居榜首。值得一提的是,Claude的评分结果向来可信,不同于某些模型为追求高分而采取的刷榜行为。

自6月Claude 3.5 Sonnet上线以来,它引发了一场技术革新,尤其是在与Cursor等AI编程工具结合后,其代码能力更是令人叹为观止。

评测基准中最引人注目的是第七行的SWE-bench Verified,这项指标主要衡量模型解决实际编程问题的能力。该评测基准由OpenAI于8月提出,而Claude 3.5直接将其纳入了自身的评分体系。

相比之下,GPT4o在这一项目上的得分为33.2%,至于o1的表现,Claude表示:"那是什么东西?不认识。"

Claude 3.5 Sonnet与GPT-4性能对比图
Claude 3.5 Sonnet与GPT-4性能对比图

目前,新版Claude 3.5 Sonnet已在Claude官网正式上线。

Claude官网界面截图
Claude官网界面截图

官网界面上,我们可以看到醒目的"new"标签。

现在可以国内访问地址,体验到最新版的ClaudeSonnet 3.5:

https://claude.maynor1024.live/

Claude 3.5 Sonnet国内访问界面截图
Claude 3.5 Sonnet国内访问界面截图

为了测试其能力,我向它提出了一个简单的要求:**"给我生成一个非常精美的俄罗斯方块游戏。"**

随即,升级版Claude 3.5 Sonnet开始了高效的代码生成过程。

令人惊叹的是,它一次性生成了280行代码,而且这个游戏是可以直接运行的。

更令人印象深刻的是,当我点击按钮发现报错时,它会主动提示是否需要修复这个bug,然后迅速提供修复后的代码,确保游戏能够成功运行。

Claude 3.5 Sonnet修复bug界面截图
Claude 3.5 Sonnet修复bug界面截图

体验地址:https://claude.site/artifacts/5a8c9be0-3f49-486d-89cc-410b37c7ed11

为了进一步测试其能力,我又提出了一个新的要求:

写个双十一大数据可视化图表

Claude 3.5 Sonnet生成双十一数据可视化图表截图
Claude 3.5 Sonnet生成双十一数据可视化图表截图

值得一提的是,如果对图表的某个模块不满意,我们还可以指定该部分的代码进行修改,这是一个非常实用的新功能:

Claude 3.5 Sonnet修改图表代码演示gif
Claude 3.5 Sonnet修改图表代码演示gif

根据参考图表,我让Claude重新生成了一版:

Claude 3.5 Sonnet重新生成的双十一数据可视化图表
Claude 3.5 Sonnet重新生成的双十一数据可视化图表

最终效果相当不错!如果再加上精准的统计数据,这份报告完全可以呈现给领导了。

这里附上体验地址:https://claude.site/artifacts/768c7e44-401e-4da3-9954-f9f59f8d7b38

通过这些实例,我们可以清晰地看到Claude 3.5 Sonnet在代码生成、问题解决和数据可视化方面的卓越表现。它不仅能快速响应用户需求,还能主动发现并修复问题,为用户提供全方位的智能辅助。这无疑将为开发者和数据分析师带来更高效、更智能的工作体验。

国内访问地址: https://agi.maynor1024.live/

Claude 3.5 Sonnet国内访问地址界面截图
Claude 3.5 Sonnet国内访问地址界面截图

本文由 mdnice 多平台发布

猜你喜欢

转载自blog.csdn.net/xianyu120/article/details/143181251