业界动态
免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT
2024-05-22 02:46:35
免费的GPT-4o足够强,但治不好OpenAI的产品焦虑,模型,用户,ChatGPT

又(you)是一(yi)次成功的PR动作。

作者 | 刘杨楠(nan)

编辑 | 王博 栗子

5月14日凌晨1点,继OpenAI在AI搜索上“虚晃一(yi)枪”之后,让萨姆·奥尔特曼(Sam Altman)感觉“像魔术(shu)一(yi)样(yang)”的新模型终于浮出水(shui)面。

不是GPT-5,不是AI搜索,而是最新旗舰生成式AI模型GPT-4o!

GPT-4o(“o”代表“omni”,意为“全能的”)是迈向(xiang)更自(zi)然的人机(ji)交互的一(yi)步——它接受文本、音频和图(tu)像的任意组合作为输入,并(bing)生成文本、音频和图(tu)像的任意组合输出。

整场发布会时长仅30分钟,OpenAI CTO米(mi)拉·穆拉蒂(Mira Murati)带来(lai)主题演讲。“这是我们第一(yi)次在易用性(xing)方面真正迈出一(yi)大步。”穆拉蒂在公司旧金山总(zong)部的现场演示中说道(dao), “这种互动变得更加自(zi)然,也更加容易。”

值得注意的是,此次发布会OpenAI CEO萨姆·奥尔特曼并(bing)未(wei)现身(shen)。在OpenAI官网披露(lu)的GPT-4o贡献者中,依然没有看到OpenAI首席科学家伊利亚·苏茨克维尔(Ilya Sutskever)的身(shen)影。

01.“GPT-4o是我们最好的模型”

整场发布会的主角,就(jiu)是OpenAI最新旗舰生成式AI模型GPT-4o。

OpenAI官网博客显示,GPT-4o(“o”代表“omni”)是迈向(xiang)更自(zi)然的人机(ji)交互的一(yi)步。它接受文本、音频和图(tu)像的任意组合作为输入,并(bing)生成文本、音频和图(tu)像的任意组合输出。

相比今年2月的Sora, OpenAI此次发布显得更有诚意——GPT-4o将免费提供给所(suo)有用户使用,Plus用户则可以享受到5倍的调用额度。

穆拉蒂表示,GPT-4o将提供与GPT-4同等水(shui)平的智能。

同时,GPT-4o的运行速度大大提升,最大亮点在于其语音交互模式采(cai)用了全新技术(shu),让聊天(tian)机(ji)器人对话的响应速度大幅提升。OpenAI官网博客显示,GPT-4o在谈话中对音频输入的平均响应时间为320毫秒,最短的响应时间为232毫秒,与人类的响应时间相似。

GPT-4o还(hai)有超高的“语言(yan)天(tian)赋”,能支(zhi)持50种语言(yan),并(bing)显着提高了非英语语言(yan)的性(xing)能,包括改进分词器以更好地压缩其中的许多语言(yan):

根据传统基准测试(shi),GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级(ji)别的性(xing)能,同时在多语言(yan)、音频和视觉功能上设(she)置了新的高水(shui)位线。

开发人员现在可以在API中访问GPT-4o。与GPT-4 Turbo相比,GPT-4o速度提高2倍,价格(ge)降(jiang)低一(yi)半,速率限制提高5倍。

在现场演示环节,GPT-4o更是展现了各类花式操作——它能根据演示者的实时要求变换语音语调,演绎话剧;能实时读(du)图(tu);甚至还(hai)跟演示者们开起(qi)玩笑(xiao),唱起(qi)歌。

此外(wai),OpenAI还(hai)发布了桌面版的ChatGPT和新的用户界(jie)面。

用户可以向(xiang)ChatGPT(由 GPT-4o 提供支(zhi)持)提出问题,并(bing)在ChatGPT回(hui)答时打断它。OpenAI表示,该模型提供“实时”响应能力,甚至可以感知用户声音中的情感,从而生成“一(yi)系(xi)列不同情感风格(ge)”的声音(包括唱歌)。

GPT-4o还(hai)升级(ji)了ChatGPT的视觉能力。给定(ding)一(yi)张(zhang)照片或一(yi)个桌面屏(ping)幕,GPT-4o可以快(kuai)速回(hui)答相关(guan)问题,主题范围包括“此软件代码中发生了什(shi)么(me)?”到“这个人穿什(shi)么(me)牌子的衬衫?”

“我们认识到这些模型正变得越来(lai)越复杂,” 穆拉蒂说道(dao),“但我们希望用户与人工智能模型的交互体验能够更加自(zi)然、轻松,让用户可以将注意力完全集中在与模型的协作上,而无需在意界(jie)面本身(shen)。”

穆拉蒂还(hai)透(tou)露(lu),未(wei)来(lai)几周内,GPT-4o将分阶段集成至OpenAI的各个产品(pin)之中,而且(qie)会在ChatGPT Plus中推出新版语音模式GPT-4o的alpha版。

OpenAI研究员威廉·费达斯(William Fedus)表示:“GPT-4o是我们最先进的新前沿模型。我们一(yi)直在LMSys arena上测试(shi)一(yi)个版本im-also-a-good-gpt2-chatbot。”

“这不仅是世界(jie)上最好的模型,而且(qie)可以在ChatGPT中免费使用,这对于前沿模型来(lai)说是前所(suo)未(wei)有的。”费达斯补充道(dao),“我们发现在更难(nan)的提示集上——特别是编码——存(cun)在更大的差距:GPT-4o比我们之前的最佳模型实现了+100 ELO。”

奥尔特曼也在X上表示:“GPT-4o是我们最好的模型。”

OpenAI此次发布几乎在想尽办法“讨好”用户,在“交互体验”上下(xia)足了功夫,直接免费开放使用更让用户感受到了OpenAI的诚意。

但「甲子光年」发现,在这种诚意背后,这家已被捧上神坛的AI创业公司,正深陷于某(mou)种焦虑之中。

02. OpenAI的产品(pin)焦虑

虽然奥尔特曼今天(tian)并(bing)未(wei)到场,但5月11日,他便亲自(zi)下(xia)场预告。可是,翻翻评论区,网友们的关(guan)注点似乎有点儿跑偏。

有人喊话奥尔特曼让OpenAI首席科学家伊利亚回(hui)归:

有人关(guan)心GPT-5到底何时发布:

伊利亚的去向(xiang)和GPT-5的发布是OpenAI留(liu)给外(wai)界(jie)的两大谜题,也是外(wai)界(jie)最关(guan)心的两大问题。

2024年,人们对OpenAI最大的期待便是GPT-5。然而,每当奥尔特曼在访谈中被问及(ji)GPT-5相关(guan)进度时,却总(zong)是支(zhi)支(zhi)吾吾、讳莫如深。奥尔特曼在普罗大众心中的画像也逐渐(jian)从一(yi)位开天(tian)辟地的怪力少(shao)年,转变为一(yi)个在各国(guo)政(zheng)客间长袖善舞,在各种场合大打太极的“成熟企业家”。

更致命的是,ChatGPT和GPT-4之后,OpenAI似乎一(yi)直没能推出相同重量级(ji)的AI产品(pin),这些都在不断消磨外(wai)界(jie)对OpenAI的期待与信心。

今年2月,OpenAI发布Sora——1份技术(shu)报告、32篇引用论文、一(yi)些画面堪(kan)比电(dian)影镜头(tou)的demo和1个故作高深的“世界(jie)模拟器”概(gai)念就(jiu)是OpenAI给出的全部,没有技术(shu)论文,也没有可公开体验的产品(pin)入口。

「甲子光年」曾向(xiang)多位AI从业者提问:“ChatGPT和Sora,谁带给你的震撼更大?”各位受访人几乎不约而同地回(hui)答:“Sora有震撼,但没ChatGPT的震撼大。”

造成这种感官差异的直接原因是,ChatGPT能直接体验,但Sora不能。虽然ChatGPT也会犯一(yi)些荒(huang)唐的错误(wu),但真实的交流感带给人们的震撼,远(yuan)远(yuan)大于只可远(yuan)观、不能上手体验的Sora。甚至不少(shao)声音开始(shi)猜测,Sora精美的Demo或许是工程(cheng)师在背后屡次微调的结果,Sora实时交互的结果“可能远(yuan)不如此”。

对于外(wai)界(jie)的猜测、质疑,OpenAI并(bing)未(wei)回(hui)应,而是迅(xun)速扔出下(xia)一(yi)个“靶子”——AI搜索。

过去一(yi)周,外(wai)媒不断有消息传出OpenAI将推出AI搜索产品(pin),更有媒体猜测,谷歌一(yi)年一(yi)度的I/O大会即(ji)将于5月14日举(ju)办,而OpenAI此举(ju)是针对谷歌的精准狙(ju)击(ji)。

OpenAI Search 测试(shi)界(jie)面,图(tu)片来(lai)源:赛(sai)博禅(chan)心

不过,AI搜索的热度炒了半天(tian),所(suo)谓(wei)的AI搜索产品(pin)最终只是虚晃一(yi)枪。

昆仑(lun)万维董事长兼CEO方汉近期在一(yi)次直播(bo)中直言(yan):“我觉得搜索引擎对于OpenAI的用户增(zeng)长也不会有根本性(xing)的变化。”有数据显示,从去年5月开始(shi),ChatGPT的C端(duan)增(zeng)长便逐渐(jian)触顶。

而产品(pin)焦虑一(yi)日不解(jie),OpenAI距离“伟大的公司”就(jiu)永远(yuan)有一(yi)墙之隔。

03. GPT-4o能治好吗?

今天(tian)再次复盘ChatGPT的成功会发现,这是一(yi)次不可复现的“无心插柳”。

2022年中,OpenAI开始(shi)训练GPT-4。半年后的11月30日,OpenAI发布ChatGPT,全球(qiu)各界(jie)都为之颤动。

OpenAI内部曾对是否发布ChatGPT有过很(hen)长一(yi)段时间争论,因为谁都无法100%确认这是正确的事情。

彼时,OpenAI对自(zi)己(ji)的定(ding)位是一(yi)家为开发人员和企业构建工具(ju)的公司,而非直接面向(xiang)普罗大众。因此,OpenAI要面临的核心挑(tiao)战,是ChatGPT的使用门槛是否足够低,以至于能让完全不懂技术(shu)的人用起(qi)来(lai)。

在此之前发布的视觉模型DaLL-E已经让OpenAI尝(chang)到了甜头(tou)。但ChatGPT能复制DALL-E的成功吗?

奥尔特曼是名副其实的“冒险(xian)派”,他鼓励公司发布ChatGPT,“尝(chang)试(shi)一(yi)下(xia)”。在他看来(lai),用户和模型进行文本形式的交互会产生一(yi)些很(hen)重要的个性(xing)化结果。

很(hen)快(kuai),用户的热情证明(ming),这次试(shi)验无比成功。从2022年11月上线的第一(yi)个完整月(2022年11月)开始(shi),到12月这一(yi)数字达到了2.66亿人次,月环比增(zeng)长了近75%。到2023年1月,总(zong)访问量翻了一(yi)番多,达到6.16亿人次,2月就(jiu)首次突(tu)破(po)10亿人次大关(guan)。

这突(tu)如其来(lai)的成功,在OpenAI的意料之外(wai)。

“我们并(bing)没有认为GPT-3系(xi)列模型已经跨越了将其应用于消费者或企业的门槛,本以为GPT-4会成为第一(yi)个跨越这道(dao)门槛的模型,所(suo)以我们的很(hen)多计划和预测都是围绕2023年3月发布GPT-4来(lai)安排的。”OpenAI COO 布拉德·莱特凯普(Brad Lightcap)此前在英伟达2024 GTC大会上分享道(dao)。

按照莱特凯普的说法,OpenAI用了6个月来(lai)适(shi)应ChatGPT的爆炸性(xing)增(zeng)长,并(bing)确保公司有足够的GPU来(lai)满足用户的需求。

直到2023年后半年,OpenAI开始(shi)感受到了来(lai)自(zi)行业一(yi)线的真实需求。OpenAI曾公布,截止2023年8月,80%的财富500强公司已采(cai)用ChatGPT。80%的统计数据是指(zhi)拥有注册ChatGPT帐户的财富500强公司的百分比,由与企业电(dian)子邮件域关(guan)联的帐户确定(ding)。

于是,OpenAI迅(xun)速行动。2023年8月28日,OpenAI推出ChatGPT Enterprise,正式进军企业市场。它提供企业级(ji)安全和隐私、无限的高速GPT-4访问、用于处理更长输入的更长上下(xia)文窗口、高级(ji)数据分析功能、自(zi)定(ding)义选项等等。

这是一(yi)个很(hen)微妙的时间点——ChatGPT流量见顶,开始(shi)走下(xia)坡路。

根据第三(san)方网站SimilarWeb的监测数据,2023年6月ChatGPT的网站与移动客户端(duan)的全球(qiu)流量(PV)环比下(xia)降(jiang)9.7%,美国(guo)地区的流量环比下(xia)降(jiang)10.3%。同时,ChatGPT的独立访客数量(UV)下(xia)降(jiang)了5.7%,访客在网站上花费的时间也下(xia)降(jiang)了8.5%。

这是自(zi)2022年11月30日发布以来(lai),ChatGPT首次出现流量负增(zeng)长。其实,ChatGPT增(zeng)长放缓的势头(tou)在2023年5月已经出现端(duan)倪,5月的增(zeng)长率仅为2.8%

当时,一(yi)家AI Lab负责人告诉(su)「甲子光年」,ChatGPT流量下(xia)滑10%,但真正的挑(tiao)战不在这里(li) 。“大部分人都是带着体验的目的,看看ChatGPT到底有多强大才去注册的,包括我也是。但这不意味着我会天(tian)天(tian)用它。除了做一(yi)些简单的科普,或者给孩子写作文之外(wai),大部分人日常其实也不太会用到。”这位AI Lab负责人说。

莱特凯普自(zi)己(ji)也在一(yi)次访谈中犀利点评ChatGPT:“人们玩儿过一(yi)会儿后就(jiu)认为它并(bing)不是真正的工具(ju),而更像一(yi)个玩具(ju)。”

更严峻的是,ChatGPT的烧钱速度同样(yang)出人意料。

当OpenAI的早期投资人埃隆·马斯克(Elon Musk)问到ChatGPT的成本时,奥尔特曼给到的数据是“每次对话的平均费用为几美分”。2023年4月,国(guo)外(wai)一(yi)位分析师估算的数据则是每天(tian)的运营成本高达70万美元。

2023年2月1日,OpenAI开始(shi)商业化探索,推出付费版本的ChatGPT Plus,定(ding)价每月20美元,提供的增(zeng)值服务包括“高峰时段免排队、快(kuai)速响应以及(ji)优先获得新功能”等。

如此看来(lai),ChatGPT虽然备受喜爱,但在商业层面,却算不上一(yi)个真正成功的产品(pin)。这些被ChatGPT烧掉的钱,就(jiu)要用B端(duan)来(lai)填。

数据显示,截至2023年11月,已经有92%的500强企业以某(mou)种形式部署ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华永道(dao)和Zapier均为OpenAI的早期客户。

C端(duan)流量与B端(duan)客户量的此消彼长之间,OpenAI也逐渐(jian)由一(yi)家伟大而光荣的非营利性(xing)AGI实验室,加速转变为一(yi)家“平庸”的商业公司——他们或许能赚到很(hen)多钱,却没有造出能够说服用户的产品(pin)。

直到今天(tian),让奥尔特曼感到“像魔术(shu)一(yi)样(yang)”的GPT-4o面世。

只是GPT-4o真能治好OpenAI的产品(pin)焦虑吗?答案或许并(bing)不清晰。

从模型能力上来(lai)看,实时语音交互是GPT-4o在多模态方面最亮眼的进展。然而事实上,语音交互类产品(pin)并(bing)不新鲜。在可查阅的历史中,AI语音交互类产品(pin)在商业化方面并(bing)没有太多成功的案例,苹果的Siri到今天(tian)都是一(yi)个十分鸡肋的功能。

而发布会上的GPT-4o,看起(qi)来(lai)依然是一(yi)个“有趣的玩具(ju)”。

从“无心插柳”的ChatGPT,到“只可远(yuan)观”的Sora、“虚晃一(yi)枪”的SearchGPT,再到今天(tian)的GPT-4o,都只是OpenAI向(xiang)世界(jie)展示其AI能力的“半成品(pin)”,而并(bing)非一(yi)个真正能够说服用户的商业产品(pin),这在某(mou)种程(cheng)度上限制了OpenAI用户的增(zeng)长。

当然,不可否认的是,从这次发布会的效果来(lai)看,GPT-4o或许会成为又(you)一(yi)个成功的PR案例,被写入OpenAI的历史。

(封面图(tu)来(lai)源:OpenAI)

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7