声音简介


北京时间5月14日凌晨,OpenAI召开了春季发布会,发布了新旗舰模型GPT-4o。“GPT-4o”的“o”代表“omni”,意思是“全能的”。从其产品介绍看,它可能是迄今人机交互最为顺滑的一个产品。今天的音频,我们就来介绍GPT-4o跟以往的大模型相比,有哪些关键的突破。我总结了三点。

第一是多模态的彻底打通。GPT-4o接受文本、语音、图像、视频等任意组合的输入和输出,它的所有输入输出由同一个神经网络处理,可以在不同模态之间丝滑切换。

第二是速度更快,反馈几乎无延迟。在过去,人们在和GPT-3.5进行语音对话时的平均延迟是2.8秒,GPT-4o可以在232毫秒内对音频输入做出反应,堪比人和人日常对话的响应速度。

第三是可以在对话过程中被随时打断,还可以根据场景需要变化语音语调和情绪情感。以往人机交互对话一旦被打断, AI会出现“断片”的情况。而在和GPT-4o聊天时,你可以随时打断对话后再继续,还可以要求它用各种语调和情绪进行回答。

吴晓波频道

5.1-5.23,吴晓波频道十周年庆,下单立减100元哦。感兴趣的同学要抓紧哦

回复@吴晓波频道
表情0/300
其他用户评论

玩具人_qr

不懂就问: 受到50年期特别国债发行的启发,再结合眼下房产和汽车去库存的迫切需要!那么可不可以把超长国债20年、30年、50年的这套举措也应用到房产和汽车以及其它大额消费行业!比如买房买车你零首付且每月只还利息,30年/5年后合同到期了再付清全款!这样不但解决了库存问题,还能活跃市场扩大内需,提振经济?何乐而不为呢?望有关部门重视研究,早日实现!

Candy_5p

吴老师太贴心了!现在苹果手机还不能用,只能在PC端。能在手机用就更方便了。

当前评论用户

646783336.7万

简介:《每天听见吴晓波·第八季》上线更新中! 这是财经作家吴晓波带领“巴九灵”们运营的知识频道,提供内容涵盖财经知识、企业管理、财富增长、职场进阶、人文见识等。挖掘新闻背后的财经知识,发现数据中的商业价值,理解上亿新中产的需求与焦虑,共同与时代成长。

TA的其他评论