免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT20240522-业界动态-www.cyts.ha.cn

免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

2024-05-22 02:46:35

免费的GPT-4o足够强，但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又(you)是一(yi)次成功的PR动作。

作者 | 刘杨楠(nan)

编辑 | 王博栗子

5月14日凌晨1点，继OpenAI在AI搜索上“虚晃一(yi)枪”之后，让萨姆·奥尔特曼（Sam Altman）感觉“像魔术(shu)一(yi)样(yang)”的新模型终于浮出水(shui)面。

不是GPT-5，不是AI搜索，而是最新旗舰生成式AI模型GPT-4o！

GPT-4o（“o”代表“omni”，意为“全能的”）是迈向(xiang)更自(zi)然的人机(ji)交互的一(yi)步——它接受文本、音频和图(tu)像的任意组合作为输入，并(bing)生成文本、音频和图(tu)像的任意组合输出。

整场发布会时长仅30分钟，OpenAI CTO米(mi)拉·穆拉蒂（Mira Murati）带来(lai)主题演讲。“这是我们第一(yi)次在易用性(xing)方面真正迈出一(yi)大步。”穆拉蒂在公司旧金山总(zong)部的现场演示中说道(dao)， “这种互动变得更加自(zi)然，也更加容易。”

值得注意的是，此次发布会OpenAI CEO萨姆·奥尔特曼并(bing)未(wei)现身(shen)。在OpenAI官网披露(lu)的GPT-4o贡献者中，依然没有看到OpenAI首席科学家伊利亚·苏茨克维尔（Ilya Sutskever）的身(shen)影。

01.“GPT-4o是我们最好的模型”

整场发布会的主角，就(jiu)是OpenAI最新旗舰生成式AI模型GPT-4o。

OpenAI官网博客显示，GPT-4o（“o”代表“omni”）是迈向(xiang)更自(zi)然的人机(ji)交互的一(yi)步。它接受文本、音频和图(tu)像的任意组合作为输入，并(bing)生成文本、音频和图(tu)像的任意组合输出。

相比今年2月的Sora， OpenAI此次发布显得更有诚意——GPT-4o将免费提供给所(suo)有用户使用，Plus用户则可以享受到5倍的调用额度。

穆拉蒂表示，GPT-4o将提供与GPT-4同等水(shui)平的智能。

同时，GPT-4o的运行速度大大提升，最大亮点在于其语音交互模式采(cai)用了全新技术(shu)，让聊天(tian)机(ji)器人对话的响应速度大幅提升。OpenAI官网博客显示，GPT-4o在谈话中对音频输入的平均响应时间为320毫秒，最短的响应时间为232毫秒，与人类的响应时间相似。

GPT-4o还(hai)有超高的“语言(yan)天(tian)赋”，能支(zhi)持50种语言(yan)，并(bing)显着提高了非英语语言(yan)的性(xing)能，包括改进分词器以更好地压缩其中的许多语言(yan)：

根据传统基准测试(shi)，GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级(ji)别的性(xing)能，同时在多语言(yan)、音频和视觉功能上设(she)置了新的高水(shui)位线。

开发人员现在可以在API中访问GPT-4o。与GPT-4 Turbo相比，GPT-4o速度提高2倍，价格(ge)降(jiang)低一(yi)半，速率限制提高5倍。

在现场演示环节，GPT-4o更是展现了各类花式操作——它能根据演示者的实时要求变换语音语调，演绎话剧；能实时读(du)图(tu)；甚至还(hai)跟演示者们开起(qi)玩笑(xiao)，唱起(qi)歌。

此外(wai)，OpenAI还(hai)发布了桌面版的ChatGPT和新的用户界(jie)面。

用户可以向(xiang)ChatGPT（由 GPT-4o 提供支(zhi)持）提出问题，并(bing)在ChatGPT回(hui)答时打断它。OpenAI表示，该模型提供“实时”响应能力，甚至可以感知用户声音中的情感，从而生成“一(yi)系(xi)列不同情感风格(ge)”的声音（包括唱歌）。

GPT-4o还(hai)升级(ji)了ChatGPT的视觉能力。给定(ding)一(yi)张(zhang)照片或一(yi)个桌面屏(ping)幕，GPT-4o可以快(kuai)速回(hui)答相关(guan)问题，主题范围包括“此软件代码中发生了什(shi)么(me)？”到“这个人穿什(shi)么(me)牌子的衬衫？”

“我们认识到这些模型正变得越来(lai)越复杂，” 穆拉蒂说道(dao)，“但我们希望用户与人工智能模型的交互体验能够更加自(zi)然、轻松，让用户可以将注意力完全集中在与模型的协作上，而无需在意界(jie)面本身(shen)。”

穆拉蒂还(hai)透(tou)露(lu)，未(wei)来(lai)几周内，GPT-4o将分阶段集成至OpenAI的各个产品(pin)之中，而且(qie)会在ChatGPT Plus中推出新版语音模式GPT-4o的alpha版。

OpenAI研究员威廉·费达斯（William Fedus）表示：“GPT-4o是我们最先进的新前沿模型。我们一(yi)直在LMSys arena上测试(shi)一(yi)个版本im-also-a-good-gpt2-chatbot。”

“这不仅是世界(jie)上最好的模型，而且(qie)可以在ChatGPT中免费使用，这对于前沿模型来(lai)说是前所(suo)未(wei)有的。”费达斯补充道(dao)，“我们发现在更难(nan)的提示集上——特别是编码——存(cun)在更大的差距：GPT-4o比我们之前的最佳模型实现了+100 ELO。”

奥尔特曼也在X上表示：“GPT-4o是我们最好的模型。”

OpenAI此次发布几乎在想尽办法“讨好”用户，在“交互体验”上下(xia)足了功夫，直接免费开放使用更让用户感受到了OpenAI的诚意。

但「甲子光年」发现，在这种诚意背后，这家已被捧上神坛的AI创业公司，正深陷于某(mou)种焦虑之中。

02. OpenAI的产品(pin)焦虑

虽然奥尔特曼今天(tian)并(bing)未(wei)到场，但5月11日，他便亲自(zi)下(xia)场预告。可是，翻翻评论区，网友们的关(guan)注点似乎有点儿跑偏。

有人喊话奥尔特曼让OpenAI首席科学家伊利亚回(hui)归：

有人关(guan)心GPT-5到底何时发布：

伊利亚的去向(xiang)和GPT-5的发布是OpenAI留(liu)给外(wai)界(jie)的两大谜题，也是外(wai)界(jie)最关(guan)心的两大问题。

2024年，人们对OpenAI最大的期待便是GPT-5。然而，每当奥尔特曼在访谈中被问及(ji)GPT-5相关(guan)进度时，却总(zong)是支(zhi)支(zhi)吾吾、讳莫如深。奥尔特曼在普罗大众心中的画像也逐渐(jian)从一(yi)位开天(tian)辟地的怪力少(shao)年，转变为一(yi)个在各国(guo)政(zheng)客间长袖善舞，在各种场合大打太极的“成熟企业家”。

更致命的是，ChatGPT和GPT-4之后，OpenAI似乎一(yi)直没能推出相同重量级(ji)的AI产品(pin)，这些都在不断消磨外(wai)界(jie)对OpenAI的期待与信心。

今年2月，OpenAI发布Sora——1份技术(shu)报告、32篇引用论文、一(yi)些画面堪(kan)比电(dian)影镜头(tou)的demo和1个故作高深的“世界(jie)模拟器”概(gai)念就(jiu)是OpenAI给出的全部，没有技术(shu)论文，也没有可公开体验的产品(pin)入口。

「甲子光年」曾向(xiang)多位AI从业者提问：“ChatGPT和Sora，谁带给你的震撼更大？”各位受访人几乎不约而同地回(hui)答：“Sora有震撼，但没ChatGPT的震撼大。”

造成这种感官差异的直接原因是，ChatGPT能直接体验，但Sora不能。虽然ChatGPT也会犯一(yi)些荒(huang)唐的错误(wu)，但真实的交流感带给人们的震撼，远(yuan)远(yuan)大于只可远(yuan)观、不能上手体验的Sora。甚至不少(shao)声音开始(shi)猜测，Sora精美的Demo或许是工程(cheng)师在背后屡次微调的结果，Sora实时交互的结果“可能远(yuan)不如此”。

对于外(wai)界(jie)的猜测、质疑，OpenAI并(bing)未(wei)回(hui)应，而是迅(xun)速扔出下(xia)一(yi)个“靶子”——AI搜索。

过去一(yi)周，外(wai)媒不断有消息传出OpenAI将推出AI搜索产品(pin)，更有媒体猜测，谷歌一(yi)年一(yi)度的I/O大会即(ji)将于5月14日举(ju)办，而OpenAI此举(ju)是针对谷歌的精准狙(ju)击(ji)。

OpenAI Search 测试(shi)界(jie)面，图(tu)片来(lai)源：赛(sai)博禅(chan)心

不过，AI搜索的热度炒了半天(tian)，所(suo)谓(wei)的AI搜索产品(pin)最终只是虚晃一(yi)枪。

昆仑(lun)万维董事长兼CEO方汉近期在一(yi)次直播(bo)中直言(yan)：“我觉得搜索引擎对于OpenAI的用户增(zeng)长也不会有根本性(xing)的变化。”有数据显示，从去年5月开始(shi)，ChatGPT的C端(duan)增(zeng)长便逐渐(jian)触顶。

而产品(pin)焦虑一(yi)日不解(jie)，OpenAI距离“伟大的公司”就(jiu)永远(yuan)有一(yi)墙之隔。

03. GPT-4o能治好吗？

今天(tian)再次复盘ChatGPT的成功会发现，这是一(yi)次不可复现的“无心插柳”。

2022年中，OpenAI开始(shi)训练GPT-4。半年后的11月30日，OpenAI发布ChatGPT，全球(qiu)各界(jie)都为之颤动。

OpenAI内部曾对是否发布ChatGPT有过很(hen)长一(yi)段时间争论，因为谁都无法100%确认这是正确的事情。

彼时，OpenAI对自(zi)己(ji)的定(ding)位是一(yi)家为开发人员和企业构建工具(ju)的公司，而非直接面向(xiang)普罗大众。因此，OpenAI要面临的核心挑(tiao)战，是ChatGPT的使用门槛是否足够低，以至于能让完全不懂技术(shu)的人用起(qi)来(lai)。

在此之前发布的视觉模型DaLL-E已经让OpenAI尝(chang)到了甜头(tou)。但ChatGPT能复制DALL-E的成功吗？

奥尔特曼是名副其实的“冒险(xian)派”，他鼓励公司发布ChatGPT，“尝(chang)试(shi)一(yi)下(xia)”。在他看来(lai)，用户和模型进行文本形式的交互会产生一(yi)些很(hen)重要的个性(xing)化结果。

很(hen)快(kuai)，用户的热情证明(ming)，这次试(shi)验无比成功。从2022年11月上线的第一(yi)个完整月（2022年11月）开始(shi)，到12月这一(yi)数字达到了2.66亿人次，月环比增(zeng)长了近75%。到2023年1月，总(zong)访问量翻了一(yi)番多，达到6.16亿人次，2月就(jiu)首次突(tu)破(po)10亿人次大关(guan)。

这突(tu)如其来(lai)的成功，在OpenAI的意料之外(wai)。

“我们并(bing)没有认为GPT-3系(xi)列模型已经跨越了将其应用于消费者或企业的门槛，本以为GPT-4会成为第一(yi)个跨越这道(dao)门槛的模型，所(suo)以我们的很(hen)多计划和预测都是围绕2023年3月发布GPT-4来(lai)安排的。”OpenAI COO 布拉德·莱特凯普（Brad Lightcap）此前在英伟达2024 GTC大会上分享道(dao)。

按照莱特凯普的说法，OpenAI用了6个月来(lai)适(shi)应ChatGPT的爆炸性(xing)增(zeng)长，并(bing)确保公司有足够的GPU来(lai)满足用户的需求。

直到2023年后半年，OpenAI开始(shi)感受到了来(lai)自(zi)行业一(yi)线的真实需求。OpenAI曾公布，截止2023年8月，80%的财富500强公司已采(cai)用ChatGPT。80%的统计数据是指(zhi)拥有注册ChatGPT帐户的财富500强公司的百分比，由与企业电(dian)子邮件域关(guan)联的帐户确定(ding)。

于是，OpenAI迅(xun)速行动。2023年8月28日，OpenAI推出ChatGPT Enterprise，正式进军企业市场。它提供企业级(ji)安全和隐私、无限的高速GPT-4访问、用于处理更长输入的更长上下(xia)文窗口、高级(ji)数据分析功能、自(zi)定(ding)义选项等等。

这是一(yi)个很(hen)微妙的时间点——ChatGPT流量见顶，开始(shi)走下(xia)坡路。

根据第三(san)方网站SimilarWeb的监测数据，2023年6月ChatGPT的网站与移动客户端(duan)的全球(qiu)流量（PV）环比下(xia)降(jiang)9.7%，美国(guo)地区的流量环比下(xia)降(jiang)10.3%。同时，ChatGPT的独立访客数量（UV）下(xia)降(jiang)了5.7%，访客在网站上花费的时间也下(xia)降(jiang)了8.5%。

这是自(zi)2022年11月30日发布以来(lai)，ChatGPT首次出现流量负增(zeng)长。其实，ChatGPT增(zeng)长放缓的势头(tou)在2023年5月已经出现端(duan)倪，5月的增(zeng)长率仅为2.8%。

当时，一(yi)家AI Lab负责人告诉(su)「甲子光年」，ChatGPT流量下(xia)滑10%，但真正的挑(tiao)战不在这里(li) 。“大部分人都是带着体验的目的，看看ChatGPT到底有多强大才去注册的，包括我也是。但这不意味着我会天(tian)天(tian)用它。除了做一(yi)些简单的科普，或者给孩子写作文之外(wai)，大部分人日常其实也不太会用到。”这位AI Lab负责人说。

莱特凯普自(zi)己(ji)也在一(yi)次访谈中犀利点评ChatGPT：“人们玩儿过一(yi)会儿后就(jiu)认为它并(bing)不是真正的工具(ju)，而更像一(yi)个玩具(ju)。”

更严峻的是，ChatGPT的烧钱速度同样(yang)出人意料。

当OpenAI的早期投资人埃隆·马斯克（Elon Musk）问到ChatGPT的成本时，奥尔特曼给到的数据是“每次对话的平均费用为几美分”。2023年4月，国(guo)外(wai)一(yi)位分析师估算的数据则是每天(tian)的运营成本高达70万美元。

2023年2月1日，OpenAI开始(shi)商业化探索，推出付费版本的ChatGPT Plus，定(ding)价每月20美元，提供的增(zeng)值服务包括“高峰时段免排队、快(kuai)速响应以及(ji)优先获得新功能”等。

如此看来(lai)，ChatGPT虽然备受喜爱，但在商业层面，却算不上一(yi)个真正成功的产品(pin)。这些被ChatGPT烧掉的钱，就(jiu)要用B端(duan)来(lai)填。

数据显示，截至2023年11月，已经有92%的500强企业以某(mou)种形式部署ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华永道(dao)和Zapier均为OpenAI的早期客户。

C端(duan)流量与B端(duan)客户量的此消彼长之间，OpenAI也逐渐(jian)由一(yi)家伟大而光荣的非营利性(xing)AGI实验室，加速转变为一(yi)家“平庸”的商业公司——他们或许能赚到很(hen)多钱，却没有造出能够说服用户的产品(pin)。

直到今天(tian)，让奥尔特曼感到“像魔术(shu)一(yi)样(yang)”的GPT-4o面世。

只是GPT-4o真能治好OpenAI的产品(pin)焦虑吗？答案或许并(bing)不清晰。

从模型能力上来(lai)看，实时语音交互是GPT-4o在多模态方面最亮眼的进展。然而事实上，语音交互类产品(pin)并(bing)不新鲜。在可查阅的历史中，AI语音交互类产品(pin)在商业化方面并(bing)没有太多成功的案例，苹果的Siri到今天(tian)都是一(yi)个十分鸡肋的功能。

而发布会上的GPT-4o，看起(qi)来(lai)依然是一(yi)个“有趣的玩具(ju)”。

从“无心插柳”的ChatGPT，到“只可远(yuan)观”的Sora、“虚晃一(yi)枪”的SearchGPT，再到今天(tian)的GPT-4o，都只是OpenAI向(xiang)世界(jie)展示其AI能力的“半成品(pin)”，而并(bing)非一(yi)个真正能够说服用户的商业产品(pin)，这在某(mou)种程(cheng)度上限制了OpenAI用户的增(zeng)长。

当然，不可否认的是，从这次发布会的效果来(lai)看，GPT-4o或许会成为又(you)一(yi)个成功的PR案例，被写入OpenAI的历史。

（封面图(tu)来(lai)源：OpenAI）

发布于：上海市

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多