GPT-4o mini上线!性价比超高的小参数模型,轻松驾驭复杂文本与视觉推理任务!

nidongde2024-07-23 18:17:2167

ChatU新增引擎支持——GPT-4o mini上线。该模型在文本智能处理与多模态推理方面表现出色,更重要的是,GPT-4o mini的核心竞争力在于其出色的成本效益,费用仅为Model-3.5的1/2。



01 关于GPT-4o mini

GPT-4o mini支持128K上下文,每个请求最多支持16K输出Tokens,并且具有截至2023年10月的知识。


GPT-4o mini以其低成本和低延迟支持广泛的任务,如:


  • 链接或并行化多个模型调用(例如,调用多个 API)。

  • 将大量上下文传递给模型(例如,完整的代码库或对话历史记录)。

  • 通过快速、实时的文本响应与客户交互(例如,客户支持聊天机器人)。


当前,GPT-4o mini在API中支持文本和视觉,未来将支持文本、图像、视频和音频输入和输出。



02 GPT-4o mini特点

GPT-4o mini在文本智能生成和多模态推理方面表现突出,在测试评估中超过了GPT-3.5 Turbo和其他小型模型。


推理任务:在文本智能和推理基准MMLU上得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。

数学和编码能力:在衡量数学推理的MGSM上,GPT-4o mini得分为87.0%,而Gemini Flash为75.5%,Claude Haiku为71.7%。

GPT-4o mini在衡量编码性能的 HumanEval上得分为87.2%,而Gemini Flash 为71.5%,Claude Haiku为75.9%。

多模态推理:GPT-4o mini在多模态推理评估MMMU上也表现出色,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。


03  GPT-4o mini使用案例

在视觉输入和输出中,在提交了一份医疗报告后,GPT-4o mini展现出了非凡的响应速度与能力,几乎立即提供了报告解析。这一过程不仅体现了其高效的信息处理能力,还体现了AI在医疗辅助诊断领域的巨大潜力与实用性。






GPT-4o mini分析结果和检验报告
随后,GPT-4o也给出了详尽的答案。




GPT-4o分析结果和检验报告
在文本使用中,小编针对同一问题对GPT-4o mini和GPT-4o进行了提问。

GPT-4o mini表示,截至其最后的知识更新(2023年10月),OpenAI并未发布名为GPT-4o mini的模型。不过,基于现有的知识对GPT-4o mini的功能和特性做出了预测。
GPT-4o mini文本测试
GPT-4o表现毋庸置疑,对GPT-4o mini模型进行了详细介绍。
GPT-4o文本测试

综合上述测试,GPT-4o mini在价格方面相较于先前的GPT-3.5展现出了显著优势,为用户提供了更高性价比的选择。而与GPT-4o相比,则稍有逊色,但这并不妨碍其成为一款性能出色的模型。

由于每位技术爱好者与应用开发者对于技术的期许及实际场景的需求不同,我们诚邀您共同探讨这两款模型的差异与优势,毕竟集思广益,方能更全面地评估并选择最适合自己的AI模型。

END

本文链接:https://qh-news.com/chatgpt/71.html

chatgpt官网可以下载吗chatgpt官网入口 知乎chatgpt官网宣传视频chatgpt官网汉化chatgpt怎样登录官网chatgpt官网中文版手机版国内怎么登陆chatgpt官网进口chatgpt短视频角本生成官网open ai官网chatgpt版本chatgpt官网哪里访问

相关文章