OpenAI o1在没有任何预告下,正式登场。
最近一段时间经常听说草莓,结果是O1
按官方的说法,对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。
它能类似《思考快与慢》这本书一样写的,
拥有系统1跟系统2,
也就是模拟了人类的深度思考,
我觉得这个模型会有质变的发展,
因为人类就是因为有慢思考的深度思考而来的,
才能研究出更牛的工具来为人类服务。
而o1则能通过深度思考来帮助人类实现这种创造结合。
个人感觉AGI估计是很快就得来。当然也带来了很高的成本推理,
咱们也不能无脑的推崇还是静看它装会B吧。。。
哈哈~~~往下看我学习记录整理的内容吧。
1、AI行业,会正式进入了一个全新的纪元?
估计o1为进入AGI的进程已经没有啥阻力了,
大家看他出来的解析参数图,
AIME 2024,一个高水平的数学竞赛,GPT4o准确率为13.4%,而这次的o1 预览版,是56.7%,还未发布的o1正式版,是83.3%。
代码竞赛,GPT4o准确率为11.0%,o1 预览版为62%,o1正式版,是89%。
最牛逼的博士级科学问题 (GPQA Diamond),GPT4o是56.1,人类专家水平是69.7,o1达到了恐怖的78%。。
Claude翻译了一下o1的图,
唉,看上图估计这就是全面碾压了吧。。。。。。
2、o1模型正在逐步开放
o1模型已经逐步向所有ChatGPT Plus和 Team用户开放,未来会考虑对免费用户开放。
分为两个模型,o1预览版和o1 mini,o1-mini就是更快更小更便宜
o1预览版每周30条,o1-mini每周50条。按以前的3小时来限制的,是每周30条,也能从侧面看出来,o1这个模型,有多贵了。
3、关于Prompt写法o1给的
OpenAI给出的最佳写法,
保持提示简单直接:模型擅长理解和响应简短、清晰的指令,而不需要大量的指导。
避免思路链提示:由于这些模型在内部进行推理,因此不需要提示它们“逐步思考”或“解释你的推理”。
使用分隔符来提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来清楚地指示输入的不同部分,帮助模型适当地解释不同的部分。
限制检索增强生成 (RAG) 中的附加上下文:提供附加上下文或文档时,仅包含最相关的信息,以防止模型过度复杂化其响应。
网上很多人说,现在o1是思考了一分钟,
但是,如果是真正的AGI,说实话,思考的越慢可能会越刺激。
当他真的,可以去做证明数学定理,去做癌症药物研发,去做天体研究呢?
每一次的思考,可以达到几小时、几天、甚至几周呢?最后的结果,可能会让所有人震惊的难以置信。
本文链接:https://qh-news.com/chatgpt/106.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介