业界动态
谷歌对垒OpenA,模型,ChatGPT,Astra
2024-05-21 07:21:23
谷歌对垒OpenA,模型,ChatGPT,Astra

近几天,科(ke)技圈最大的新闻莫过于OpenAI和谷歌这两场发(fa)布会。

24小时(shi)之(zhi)内,OpenAI、谷歌这两家AI巨头相(xiang)继亮剑。

5月14日,OpenAI CEO Sam Altman亲自下场造势,在20多分钟的发(fa)布会中,用全新的多模态模型(xing)GPT-4o唤醒了人们对电影《Her》中人工智能系统(tong)“萨曼莎”的幻想。

次日,谷歌宣布升级Gemini,推出“AI全家桶(tong)”,推出集成(cheng)AI的搜索引擎,用AI重塑Android。它试(shi)图借此(ci)重振旗鼓,抢(qiang)回AI赛道(dao)上的主动权。过去(qu)一年多里(li),OpenAI多次截胡谷歌,抢(qiang)在谷歌之(zhi)前发(fa)布新技术(shu)、产品。

无论是双方在技术(shu)上的比拼,还是OpenAI牵手苹果,都表明(ming),OpenAI这家AI届的当红明(ming)星都对谷歌造成(cheng)了前所(suo)未有威胁(xie)。

当然,手握搜索入口、安卓生态王(wang)牌的谷歌的护城河在短期内难以攻破。然而在颠覆产业格局的AI时(shi)代里(li),面对后浪的追赶,谷歌等科(ke)技巨头不能松懈,否者,便是一个时(shi)代的远去(qu)。

交战

尽管被(bei)OpenAI抢(qiang)占了先机(ji),但谷歌显然是有备而来。

OpenAI推出能说(shuo)会道(dao)的GPT-4o,谷歌也有自己的萨曼莎——Project Astra。

“我(wo)脑海中已经有这个愿(yuan)景很长一段(duan)时(shi)间了。”谷歌DeepMind的负责人、谷歌人工智能工作(zuo)负责人Demis Hassabis说(shuo)。这些年,他一直(zhi)在思考和研究人工智能,思考如何让机(ji)器更(geng)像人。

在他的设想中,一个人工智能Agent必须能像人一样理解并(bing)对复杂灵活的世界做出反馈。它要能看(kan)到文本并(bing)且有所(suo)反应(ying),并(bing)且必须有主动性、可(ke)被(bei)教育的而且有个性,所(suo)以能自然地(di),没(mei)有延(yan)迟(chi)地(di)和它交谈。最终,这些所(suo)有的想象就成(cheng)了Project Astra。“就是那(na)个帮(bang)手,”Hassabis说(shuo),“它很有用,你(ni)已经习惯它在你(ni)需要的时(shi)候(hou)一直(zhi)在那(na)里(li)。”

从演示视频来看(kan),Project Astra与Hassabis的设想显然还有距离(li)。甚(shen)至(zhi)与GPT-4o相(xiang)比,延(yan)迟(chi)也更(geng)高,交流仍然不够自然。但当Project Astra准确说(shuo)出“眼镜在书桌上,红色苹果旁(pang)边”时(shi),还是获得了在场观众的惊呼声。

Project Astra的出现,也被(bei)视作(zuo)是对GPT-4o的正面回应(ying)。

这并(bing)非是OpenAI和谷歌的第(di)一次正面交战。今年2月,在谷歌发(fa)布会一周后,OpenAI悄无声息抛出重磅(pang)炸弹,推出了首款文本转视频模型(xing)——Sora。尽管Sora至(zhi)今未曾开放(fang)使用,仍然给整个科(ke)技圈带来了震撼。

对于OpenAI扔下的这颗(ke)炸弹,谷歌同样在开发(fa)者大会上给出反击,发(fa)布了AI媒体创(chuang)作(zuo)模型(xing)Veo。据介绍(shao),Veo能够生成(cheng)高质量的1080p视频,并(bing)且依托(tuo)于Imagen 3这一最新的文本到图像框架(jia)。这些AI生成(cheng)的视频可(ke)以持续超过一分钟,Veo还能够理解电影制作(zuo)和视觉技术(shu)的专业概念,如延(yan)时(shi)拍摄等。

不仅如此(ci),谷歌将Gemini集成(cheng)到了旗下几乎所(suo)有产品之(zhi)中,尤其是其优势业务——搜索,将搜索能力变得更(geng)为(wei)强大。

尽管两场发(fa)布会,一个仅有20多分钟,一个长达2小时(shi),对两家公司而言,却是一次技术(shu)上的巅峰对决。

焦虑(lu)

两大AI巨头贴身肉搏背后,是AI厂商的商业化焦虑(lu)。

2015年,名不见经传的OpenAI在硅谷成(cheng)立(li)。彼时(shi),它还是一家非营利机(ji)构。依靠着微软的10亿美元投资,过着扫地(di)僧(seng)的生活。

自2022年11月,ChatGPT问世后,OpenAI一炮打响,商业化进程也不断加速。2024年4月,OpenAI的COO称(cheng),目前企业版ChatGPT的注册用户(hu)超过60万,而今年1月这一数字为(wei)15万多。

受惠于企业对AI技术(shu)的需求,消息称(cheng),OpenAI2023年年收入已过20亿美元。

在这场由ChatGPT引发(fa)的AI热浪下,国内外科(ke)技大厂纷纷坐上牌桌。

2023年2月6日,谷歌宣布推出对话式(shi)生成(cheng)人工智能聊天机(ji)器人Bard,这是谷歌旗下大模型(xing)Gemini的前身;Meta则官宣发(fa)布Llama;同年3月,美国公司Anthropic推出Claude;国内公司也立(li)马跟上,百度发(fa)布文心一言,阿里(li)推出通义千问,华为(wei)旗下则是盘古,商汤也上新日日新。

科(ke)技大厂纷至(zhi)沓来,OpenAI想要走通商业化之(zhi)路,抢(qiang)占先机(ji),就必须保证其技术(shu)上的领先,不断推出新的更(geng)强大的模型(xing)。不过,目前看(kan)来,这一路径变得更(geng)加艰难。

经过一年多的发(fa)展,各(ge)厂商相(xiang)继推出了对标GPT-4的大模型(xing)。

更(geng)具挑战的是,OpenAI迭代的速度开始变慢(man)了。从第(di)一代ChatGPT到ChatGPT的发(fa)布,OpenAI只(zhi)用了4个多月。但距离(li)ChatGPT-4发(fa)布已经过去(qu)1年多,众人期待的ChatGPT-5仍未现身。GPT-4o的确令人印象深刻,但还不足以给整个行业带来足够的惊艳。

当然,OpenAI变慢(man),主要受制于大模型(xing)迭代的客观规律。越大越强的模型(xing),数据和算力需求就更(geng)高。最终,这些都转化成(cheng)OpenAI的成(cheng)本压力。

相(xiang)比于OpenAI庞大的研发(fa)成(cheng)本,超20亿美元的年收入依旧是杯水车薪。Sam Altman表示,由于构建和运行其模型(xing)的成(cheng)本高昂,OpenAI仍然处于亏损状态。随着OpenAI开发(fa)更(geng)复杂的模型(xing),预计支出将继续超过收入增长。OpenAI可(ke)能还需要筹集数百亿美元才能满(man)足这些成(cheng)本。

除了外部竞争,OpenAI还要面临(lin)“内忧”。5月15日,自去(qu)年年底“宫斗”事件之(zhi)后就未曾露面的Ilya Sutskever官宣离(li)开,表示自己已经有了下一个计划,但目前还不能透露细节。

作(zuo)为(wei)OpenAI的联合(he)创(chuang)始人和首席科(ke)学家,Ilya Sutskever主导了GPT系列大模型(xing)以及DALLE系列模型(xing)的研发(fa)。尽管不曾出席GPT-4o的发(fa)布会,但在GPT-4o主页上,Ilya的名字出现在“额外领导者”一栏。Ilya Sutskever的离(li)开,对OpenAI商业化的影响,仍然难以判断。

追赶

当技术(shu)之(zhi)间的差距逐渐缩(suo)小,AI厂商之(zhi)间的竞争也步(bu)入下半(ban)场。

在两场发(fa)布会上,OpenAI和谷歌默契(qi)地(di)开始关注端(duan)侧。GPT-4o推出Mac版本应(ying)用,谷歌则用Gemini重塑Android。

中国银河证券分析认为(wei),GPT-4o发(fa)布预示着AI Agent新一轮(lun)竞争序(xu)幕即将拉开,叠(die)加macOS桌面版ChatGPT集成(cheng),端(duan)侧AI革(ge)命在即,此(ci)外B端(duan)企业服务市场可(ke)能会因为(wei)GPT-4o的易用性和普惠性而迎来新的增长机(ji)遇。

新的商机(ji)下,谁能抢(qiang)得先机(ji),占领更(geng)多终端(duan),谁就能先行占有市场。

在这方面,谷歌拥有天然的优势。谷歌旗下拥有谷歌搜索、Gmail、Youtube、Chrome浏览(lan)器等一系列应(ying)用,构建了强大的生态。

相(xiang)较(jiao)之(zhi)下,作(zuo)为(wei)第(di)一个推出大模型(xing)的公司,尽管OpenAI在AI红利之(zhi)下,创(chuang)下了一系列记(ji)录。其用户(hu)体量和谷歌相(xiang)比,仍然有着不小差距。

Similarweb统(tong)计数据显示,ChatGPT今年4月全球(qiu)访问量为(wei)18亿次,相(xiang)比3月有所(suo)上升。与此(ci)同时(shi),尽管谷歌4月的访问量相(xiang)比3月有所(suo)减少,但仍达到了834.9亿次。

更(geng)不用说(shuo),谷歌还拥有Android。在今年开发(fa)者大会上,谷歌对Android Studio进行了升级,集成(cheng)了更(geng)多AI功(gong)能,方便开发(fa)者调用Gemini API进行软件开发(fa)。

英伟达人工智能工作(zuo)室负责人Jim Fan表示,谷歌做对了一件事,他们终于努力将人工智能整合(he)到搜索框中。在他看(kan)来,分发(fa)是谷歌的护城河。在这一背景之(zhi)下,Gemini不一定要做世界上最好的模型(xing),就可(ke)以成(cheng)为(wei)世界上使用量最多的模型(xing)。

在OpenAI和谷歌的这场战争中,谷歌拥有Android等一系列产品,而OpenAI缺一个苹果。

作(zuo)为(wei)2023年手机(ji)出货量一哥,去(qu)年一年里(li),iPhone出货量达到了2.346亿台,市场份额为(wei)20.1%。如果OpenAI旗下大模型(xing)真能取代“Siri”,成(cheng)为(wei)搭载在数亿苹果设备上的AI 智能助手,在搜索体验、效率提升上颠覆现有生态,对于OpenAI而言,或许一切将变得不同。

发(fa)布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7