今天凌晨OpenAI(当地时间13日上午10点)举行了一场很短(半个小时左右)的发布会,总的来说没有惊艳的功能,但我们可以了解一下最新能力,学习它,更能开拓你的工作思路。
简单概括发布会内容:
1、GPT-4o是多模态模型。能力横跨文本、视觉和语音,而且能力有了显著提升,这是要“告别”文字的表述,全面往语音和摄像头的描述发展。
2、像人类一样聊天。GPT-4o完全拥有GPT-4的能力,但反应速度更快,语音聊天时可以随意打断,越来越像正常人的聊天状态。
两人+GPT-4o的对话
3、辅导做题。实时视频,GPT-4o可以读懂题目,并可以语音交流这道题的解法,可以直接解决“陪孩子写作业崩溃发飙”问题。
4、编程助手。可以看懂桌面打开的代码窗口,程序员只要highlight(划出)代码,并通过语音交流,GPT-4o就可以作答了。
highlight代码之后,语音交流
5、实时翻译。可以实时翻译,而且速度很快,普通翻译人员是真的没有活路了,只有继续往更专业的翻译学习。
还有分析数据生成图表、识别人类表情、赛事视频的解说等功能,另外ChatGPT也发布了桌面版,支持苹果手机。
GPT-4o将在近期开放使用,Plus用户可以优先使用,可以期待一下。
写在最后,OpenAI的产品在国内使用虽然比较曲折,但是它是行业的方向标,所以做AI大模型产品以及相关产品的内容都可以关注了解一下它的功能。
本文链接:https://qh-news.com/chatgpt/30.html
GPT-4oGPT4ogpt-4o检测人的情绪gpt-4o多模态大模型发布GPT-4o免费GPT-4o官网GPT4o官网