谁是最强编程大模型？从六大方向横向对比Canvas、o1、ChatGPT4o、Claude3.5 Sonnet

chatgpt2024-10-10 10:18:15640

先做个广告：如需代注册帐号或代充值Chatgpt Plus会员，请添加站长客服微信：pingzi7749

用过Claude的小伙伴，应该都知道，Claude相对于ChatGPT4o的优势就在于编程能力、写作能力和可视化能力。半个月前o1草莓模型的发布，加强了ChatGPT在编程和写作方面的能力，小编写亲测过，o1-mini的编程能力全方位碾压Claude。

Canvas是一个全新的交互界面，旨在帮助用户与ChatGPT在写作和编程方面进行更紧密的协作。它不再局限于简单的对话框，而是提供了一个可以与AI“并肩作战”的工作空间。

说白了，就是要360°无死角的干死Claude。

在Canvas界面中，你可以：

高亮标注重点内容，让AI更懂你的需求
直接编辑AI生成的文字或代码
使用快捷菜单进行批量操作
一键撤销恢复之前版本

OpenAI研究主管Karina Nguyen表示，Canvas代表了她心目中“终极AGI界面”的雏形——一个能随人类偏好不断进化、自我变形，并创造全新人机交互方式的“空白画布”。

Canvas有哪些强大功能？

Canvas的强大功能包括对写作和编程任务的全面支持，使其成为用户进行各类创作的高效工具。它包含了一些强大而灵活的功能，使得写作和编程更加方便和高效。

写作助手的升级

Canvas为写作任务提供了五种便捷的功能：

编辑建议：Canvas可以为用户提供实时的反馈和改进建议，帮助用户优化文章的质量。
调整长度：无论是需要简化文本还是扩展内容，只需点击一下即可调整文章的长度。
阅读水平调节：从幼儿园水平到研究生水平，Canvas可根据需要调整文本的阅读复杂度，帮助不同受众更好地理解内容。
最终润色：包括语法、清晰度和一致性的全面检查，使文章达到出版级别的标准。
添加表情符号：为文章增添情感的表情符号，使内容更加生动，增加与读者的互动感。

编程功能的提升

Canvas在编程任务方面也引入了五个高效的快捷功能：

代码审查：系统自动提供代码改进的建议，以优化代码质量和性能。
添加日志语句：在代码中插入调试信息（如print语句），便于追踪代码执行过程。
生成注释：自动生成代码注释，帮助开发者和团队更好地理解代码。
修复错误：检测代码中的错误并重写有问题的部分，从而有效修复bug。
编程语言转换：支持多种语言（包括JS、TS、Python、Java、C++、PHP等）之间的代码转换，帮助开发者轻松跨语言开发。

下面，我们分六项（代码能力、代码优化能力、解读代码能力、测试用例及说明能力、转码能力、添加注释能力）横线对比一下Canvas、ChatGPT4o、Claude3.5 Sonnet、o1-preview、o1-mini，看看孰强孰弱。

都是代码AI实测，文章较长，想直接看结论的，可以直接跳到文末~

round 1：代码能力

Prompt：请根据下面描述，给出解题思路，通过Java代码解答此题，关键代码添加注释，并根据示例中的输入输出进行代码测试，代码如果有错误，请重新修改代码

Canvas

Canvas给出了解题思路、可修改的Java代码、代码解释、测试用例。

ChatGPT4o

ChatGPT4o给出了解题思路、Java代码、代码解释、测试用例。

o1-preview

o1-preview给出了解题思路、Java代码、代码解释、测试用例、测试说明、注意事项、总结。

o1-mini给出了解题思路、Java代码、代码说明、4个测试用例总结。

验证代码正确率，我们将四个大模型生成的代码Copy到Idea中，通过测试用例测试一下。

测试通过，通过率100%。

代码review：

如下图所示，左侧为ChatGPT4o，右侧为Claude3.5 Sonnet。

肉眼可见，o1-preview代码共86行，o1-mini代码共92行，ChatGPT4o代码共74行，Claude共54行，相差20行。Claude3.5 Sonnet明显更加简洁。

o1-mini号称拥有更强的编程能力，仔细一看，发现o1-mini新增了很多输入输出校验，增强了代码的健壮性。

代码能力小结：
Canvas给出了解题思路、可修改的Java代码、代码解释、测试用例。

ChatGPT4o给出了解题思路、Java代码、代码解释、测试用例。

Claude3.5 Sonnet给出了解题思路、Java代码、代码解释、测试用例，还给出了算法的时间复杂度。

o1-preview给出了解题思路、Java代码、代码解释、测试用例、测试说明、注意事项、总结。

o1-mini给出了解题思路、Java代码、代码说明、4个测试用例总结。

通过review代码，Claude3.5 Sonnet明显更加简洁、o1-mini更加缜密。

代码能力，o1-mini >o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o

round 2：代码优化

PS：我们将“通过回溯算法解答猴子吃桃的代码”发给它们，让它们对代码进行优化。

Canvas

Canvas 指出了代码存在3个问题：

回溯算法效率低下
不必要的排序
回溯递增速度存在效率瓶颈

Canvas给出了解决方案、改进方向、可编辑的代码、结论。

ChatGPT4o

ChatGPT4o指出了代码存在4个问题：

效率低，递归回溯，时间复杂度为 O(N)
递归深度限制，可能会导致 StackOverflowError
不必要的排序
全局变量使用，不符合编码规范

ChatGPT4o给出了优化后的代码、关键点、下一步改进建议。

Claude3.5 Sonnet

Claude指出了代码存在4个问题：

效率低，递归回溯，时间复杂度为 O(N)
不必要的排序
全局变量使用，不符合编码规范
代码没有处理输入异常的情况

Claude给出了优化建议、优化后的代码、优化说明、小总结。

o1-preview
o1-preview指出了代码存在4个问题：

效率低下
缺少输入校验
不必要的排序操作
全局变量的使用

o1-preview给出了优化建议、优化后的代码、代码说明、测试示例、优化效果、总结。

o1-mini
o1-mini指出了代码存在6个问题：

递归深度过大
效率低下
不必要的排序
缺乏输入验证
静态变量的使用
错误的测试用例预期

o1-mini给出了优化建议、优化后的代码、代码说明、4个测试示例、总结。

代码优化小结：

Canvas指出了3项问题，ChatGPT4o、Claude、o1-preview都指出了4项问题，但o1-mini指出了6个问题。

给出了给出了优化建议、优化后的代码、代码说明、测试示例、优化效果、总结。

代码优化能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet = ChatGPT4o

round 3：解读代码

Prompt：请给出代码的解题思路

Canvas

Canvas给出了具体的解题思路、代码解读、测试用例

ChatGPT4o

ChatGPT4o给出了具体的解题思路、优化后的代码、代码解析、建议的下一步改进

Claude3.5 Sonnet

Claude3.5 Sonnet给出了优化后代码的解题思路：

问题分析
输入处理
初始验证
二分查找最小速度
验证函数
返回结果
分析代码优势

Claude3.5并没有再次输出代码，其实这一点是好评的，因为上面已经输出过了，完全没必要再次输出。

o1-preview
o1-preview给出了具体步骤、整体思想、代码解释、示例运行、可能的问题和优化、优化后的解法思路、总结。

o1-mini

o1-mini给出了问题分析、代码解读、主要步骤解析、存在的问题、优化建议、优化后的解题思路、优化后的示例代码、优化后的代码说明、5个示例测试、总结。

解读代码小结：

ChatGPT4o看似给的东西比较多，Claude3.5只是返回了解题思路，Canvas就是可在线编辑的ChatGPT4o。

o1-mini给的东西更多，牛逼plus，真顶。

解读代码能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o

round 4：测试用例及说明

Prompt：给出3个测试用例和说明

Canvas

Canvas给出了三个测试用例，涵盖了不同的场景、可在线编辑的完整代码及测试用例、测试用例结果

ChatGPT4o

ChatGPT4o给出了三个测试用例，涵盖了不同的场景、完整代码及测试用例、测试用例结果

Claude3.5 Sonnet

Claude3.5 Sonnet给出了3个测试用例,并对每个用例进行详细说明。

这些测试用例涵盖了几种不同的情况:

正常情况,需要计算的最小速度
需要较高速度才能完成的情况
无法完成任务的情况(时间不足)

o1-preview
o1-preview给出了4个测试用例和总结。

o1-mini

o1-mini 直接给出了5个测试用例和说明，还给出了小总结。

正常情况
边界情况
无效输入

测试用例及说明能力小结：

ChatGPT4o给出的东西很多，又输出一遍完整代码，但是回答内容有些重复。

Canvas就是可在线编辑的ChatGPT4o。

Claude3.5 Sonnet给出了3个测试用例,并对每个用例进行详细说明，还指出了3个测试用例覆盖了3种不同的情况。

o1-preview给出了4个测试用例和总结。

o1-mini 直接给出了5个测试用例和说明，还给出了小总结。

测试用例及说明能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o

round 5：Java转Python

Prompt：将代码转为Python语言

Canvas

Canvas给出了可在线编辑的Python代码、关键代码解析、测试用例

ChatGPT4o

ChatGPT4o给出了Python代码、关键代码解析、测试用例

Claude3.5 Sonnet

Claude3.5给出了Python代码、解题思路、时间复杂度

o1-preview
o1-preview给出了Python代码实现、代码说明、测试示例、注意事项、运行方法

o1-mini
o1-mini给出了解题思路、主要步骤、Python代码实现、代码说明、代码优化点、5个测试示例、结论

转码能力小结：

ChatGPT4o和Claude3.5都给出了Python代码、解题思路、测试用例，测试后，通过率100%。

o1-preview给出了Python代码实现、代码说明、测试示例、注意事项、运行方法。

o1-mini给出了解题思路、主要步骤、Python代码实现、代码说明、代码优化点、5个测试示例、结论。

转码能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet = ChatGPT4o

转码能力，旗鼓相当。

round 6：添加注释

ChatGPT4o

Claude3.5 Sonnet

ChatGPT4o和Claude3.5都为Python代码添加了详细的代码注释，能力堪称顶级。

Canvas、o1-preview和o1-mini给出的代码自带详细的代码注释，不用添加了...

添加注释能力，o1-mini > o1-preview > Canvas> Claude3.5 Sonnet = ChatGPT4o

总结

我们分别从六大方面对比了Canvas、o1-mini、o1-preview 、ChatGPT4o和Claude3.5 Sonnet。

代码能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o
代码优化能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o
解读代码能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o
测试用例及说明能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o
转码能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet = ChatGPT4o
添加注释能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet = ChatGPT4o

就今天的测试而言，我们不难看出，在编程方面，o1-mini仍是最强。

Canvas是在ChatGPT4o的基础上，添加了Artifacts可视化在线编辑功能，弥补了ChatGPT4o相较于Claude的不足。

编程能力：

o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o

来源：哪吒编程

本文链接：https://qh-news.com/chatgpt/117.html

chatgpt插件官网怎样进chatgpt官网 chatgpt官网功能介绍 chatgpt官网什么样子 chatgpt4.0 官网地址 chatgpt官网入口更新了吗中国chatgpt官网 chatgpt4.0只有官网才能用吗苹果手机如何登录chatgpt官网 chatgpt官网永久免费免登录

ChatGPT的翻译水平如何？实测对比与使用技巧全解析
ChatGPT翻译水平实测与技巧解析（约150字），ChatGPT在多语种翻译中展现出接近专业工具的潜力，尤其在英语、西班牙语等主流语言互译时准确度较高，但对复杂文化隐喻或专业术语仍需人工校对，实...
chatgpt教程2026-01-1510ChatGPT 翻译水平 chatGPT翻译水平
用ChatGPT炒股靠谱吗？揭秘AI辅助投资的真相与技巧
核心答案用ChatGPT炒股不能完全替代人工决策，但可以作为辅助工具，帮助分析市场情绪、总结财经新闻、优化投资策略，它的优势在于快速处理信息，但缺乏实时数据和专业金融判断力，需结合传统分析方法使用，C...
chatgpt教程2026-01-159AI投资炒股技巧用chatgpt炒股
ChatGPT满负荷运转怎么办？5个高效解决方法与预防指南
当ChatGPT因高并发请求出现满负荷运转时，可通过以下策略保障服务稳定：1. **错峰使用**，避开流量高峰时段；2. **精简提问**，用清晰简洁的指令减少计算负载；3. **启用缓存**，对重复...
chatgpt教程2026-01-1411负载优化扩容升级 chatgpt满负荷运转
ChatGPT是个软件吗？一文解析它的本质与使用价值
ChatGPT既是一个软件（以应用程序形式存在），也是一个由OpenAI开发的人工智能模型，它可以通过网页、手机APP或API集成到其他软件中使用，但其核心是基于GPT架构的AI技术，而非传统意义上...
chatgpt教程2026-01-1411ChatGPT 本质 chatgpt是个软件吗
ChatGPT中文镜像是什么？国内用户如何安全使用？
核心答案速览ChatGPT中文镜像是指通过技术手段在国内搭建的、可访问的ChatGPT仿制网站或应用程序，它们通常提供类似的功能但不受官方支持，目前国内用户可通过三种合法途径使用：1) 官方API接口...
chatgpt教程2026-01-1311ChatGPT 安全使用 ChatGPT中文镜像
ChatGPT暂停服务怎么办？5个应急方案与深度解析
当ChatGPT暂停服务时，可采取以下应急方案：1. **切换同类工具**：使用Claude、Gemini等替代AI；2. **本地部署模型**：运行开源大模型如Llama 3；3. **API备用方...
chatgpt教程2026-01-1227ChatGPT暂停服务应急方案 chatgpt暂停服务
ChatGPT共享账号安全吗？5大风险与替代方案全解析
核心答案：ChatGPT共享账号存在封号风险、隐私泄露、功能限制等隐患，官方明确禁止此行为（OpenAI服务条款第4.3条），建议使用企业版、API或家庭订阅等合规替代方案，以下是详细分析与解决方案，...
chatgpt教程2026-01-1224共享账号安全风险 ChatGPT共享账号
如何在国内使用ChatGPT？完整教程与常见问题解答
### 国内使用ChatGPT完整指南（，**访问方式** ，1. **官方途径**：通过OpenAI官网注册（需境外网络环境+海外手机号验证），支持付费升级GPT-4。，2. **国内平替**...
chatgpt教程2026-01-1029ChatGPT 国内使用如何在国内使用chatgpt

谁是最强编程大模型？从六大方向横向对比Canvas、o1、ChatGPT4o、Claude3.5 Sonnet

在Canvas界面中，你可以：

Canvas有哪些强大功能？

写作助手的升级

编程功能的提升

round 1：代码能力

ChatGPT4o

代码能力小结：Canvas给出了解题思路、可修改的Java代码、代码解释、测试用例。

代码能力，o1-mini >o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o

round 2：代码优化

ChatGPT4o

Claude3.5 Sonnet

o1-previewo1-preview指出了代码存在4个问题：

o1-preview给出了优化建议、优化后的代码、代码说明、测试示例、优化效果、总结。

o1-minio1-mini指出了代码存在6个问题：

递归深度过大

效率低下

不必要的排序

缺乏输入验证

静态变量的使用

错误的测试用例预期

o1-mini给出了优化建议、优化后的代码、代码说明、4个测试示例、总结。

round 3：解读代码

ChatGPT4o

Claude3.5 Sonnet

o1-previewo1-preview给出了具体步骤、整体思想、代码解释、示例运行、可能的问题和优化、优化后的解法思路、总结。o1-mini

o1-mini给出了问题分析、代码解读、主要步骤解析、存在的问题、优化建议、优化后的解题思路、优化后的示例代码、优化后的代码说明、5个示例测试、总结。

round 4：测试用例及说明

ChatGPT4o

Claude3.5 Sonnet

o1-previewo1-preview给出了4个测试用例和总结。o1-mini o1-mini 直接给出了5个测试用例和说明，还给出了小总结。正常情况边界情况无效输入测试用例及说明能力小结：

测试用例及说明能力，o1-mini > o1-preview > Canvas > Claude3.5 Sonnet > ChatGPT4o

round 5：Java转Python

ChatGPT4o

Claude3.5 Sonnet

o1-previewo1-preview给出了Python代码实现、代码说明、测试示例、注意事项、运行方法

o1-minio1-mini给出了解题思路、主要步骤、Python代码实现、代码说明、代码优化点、5个测试示例、结论

转码能力，旗鼓相当。

round 6：添加注释

ChatGPT4o

Claude3.5 Sonnet

添加注释能力，o1-mini > o1-preview > Canvas> Claude3.5 Sonnet = ChatGPT4o

总结

相关文章

代码能力小结：
Canvas给出了解题思路、可修改的Java代码、代码解释、测试用例。

o1-preview
o1-preview指出了代码存在4个问题：

o1-mini
o1-mini指出了代码存在6个问题：

o1-preview
o1-preview给出了具体步骤、整体思想、代码解释、示例运行、可能的问题和优化、优化后的解法思路、总结。

o1-mini

o1-preview
o1-preview给出了4个测试用例和总结。

o1-mini

o1-mini 直接给出了5个测试用例和说明，还给出了小总结。

正常情况
边界情况
无效输入

测试用例及说明能力小结：

o1-preview
o1-preview给出了Python代码实现、代码说明、测试示例、注意事项、运行方法

o1-mini
o1-mini给出了解题思路、主要步骤、Python代码实现、代码说明、代码优化点、5个测试示例、结论