业界动态
科幻电影场景或成为现实 OpenAI发布“全能”人工智能模型,ChatGPT,用户,米拉·穆拉蒂
2024-05-17 10:53:48
科幻电影场景或成为现实 OpenAI发布“全能”人工智能模型,ChatGPT,用户,米拉·穆拉蒂

参考消息网5月15日报道 据法新社(she)5月13日报道,美国开(kai)放人工智能研究(jiu)中心(OpenAI)13日发(fa)布了性能更佳、更像人类(lei)的人工智能(AI)模型,该技术是其流行的聊天生成预训练转换器(ChatGPT)的基(ji)础,并向所有注册用户免费开(kai)放。

OpenAI旗舰产品发(fa)布更新的时间恰好在搜索(suo)引擎巨头谷歌预计将发(fa)布关于“双子座”人工智能模型(Gemini)公告的前一天,谷歌正利用这一人工智能工具与OpenAI展开(kai)正面竞争。

OpenAI首席技术官米拉·穆拉蒂在备受期待的旧金山发(fa)布会上说:“能把GPT-4o带给所有的免费用户,我们感到非常(chang)非常(chang)兴奋。”

OpenAI表示,新模型GPT-4o(其中的英文小写字(zi)母o代(dai)表omni,意为“全能、全面的”)将在未来几周更新到OpenAI的各个产品中,付费用户可以无限制地使用该工具。

OpenAI表示,该模型可以生成内容或理解语(yu)音、文本或图像形式的命令。

灵(ling)感来源是《她》

OpenAI首席执行官萨姆·奥尔特曼在一篇博客文章中说:“新的语(yu)音(和视频)模式是我用过的最好的电脑界面。感觉就像电影里的人工智能。”

奥尔特曼之前曾表示,美国科幻电影《她》中由斯嘉丽·约翰逊配音的人工智能角色是他的灵(ling)感来源,他希(xi)望与人工智能的互动能变得像电影中那样。

他补充说:“我过去与电脑交谈从来都不觉得很自然(ran);但现在感到很自然(ran)。”

穆拉蒂和OpenAI的工程(cheng)师在线(xian)上直播的发(fa)布会中展示了GPT-4o的新功能,他们给增强版的ChatGPT聊天机器人提出各种挑战。

在演示中,OpenAI的工作人员主(zhu)要向语(yu)音版本的ChatGPT提出问(wen)题,ChatGPT则以笑话和类(lei)似人类(lei)的谈笑来回应。

这款人工智能可以把英语(yu)翻译成意大利语(yu),理解人的面部表情,并协(xie)助(zhu)用户一步一步地解决很难的代(dai)数问(wen)题。

OpenAI表示,GPT-4o在文本、推理和编码(ma)智能方面与之前的版本具有相同的功能,并在多语(yu)言对话、音频和视觉方面设定(ding)了新的行业标准。

在一次演示中,ChatGPT成功地通过智能手(shou)机摄像头解读了一名OpenAI员工周围的环境,用一种友好、女性化的声音说话,与电影《她》中的人工智能机器人没什么不同。

与人类(lei)更相似

13日的发(fa)布会只是人工智能竞赛(sai)的最新一幕,OpenAI背后的微软公司已经超越苹果公司,成为全球(qiu)按市(shi)值计算最大的公司。

OpenAI和微软正与谷歌展开(kai)激烈(lie)竞争,双方都想成为生成式人工智能的最主(zhu)要参与者,而脸书网站(zhan)的母公司元宇宙平台公司和新贵Anthropic公司也在采取重大举措参与竞争。

向所有用户开(kai)放新模型可能会引发(fa)对OpenAI盈利途径的质疑,因(yin)为人们怀(huai)疑普通用户是否准备好支(zhi)付订阅(yue)费用。

到目(mu)前为止,OpenAI或谷歌的聊天机器人只有性能较(jiao)低的版本可以免费提供给用户。

奥尔特曼在博客中说:“我们是一家企业,会找到很多可收费的地方。”

另据美国消费者新闻(wen)与商业频道网站(zhan)5月13日报道,OpenAI周一发(fa)布了一个新的人工智能模型和ChatGPT桌面版,同时更新了用户界面。这是该公司为扩大其热门聊天机器人的使用范围所做的最新努(nu)力。

OpenAI技术部门负责人穆拉蒂在直播活动中说,这次更新使得所有OpenAI用户都能使用GPT-4。新模型GPT-4o“速度快得多”,文字(zi)、视频和音频能力均(jun)有所提高。OpenAI称,它计划(hua)最终使用户能与ChatGPT进行视频聊天。

穆拉蒂说,新模型使ChatGPT能以更快的速度、更好的质量处(chu)理50种不同的语(yu)言。

她还说,GPT-4o的速度是GPT-4 Turbo的两倍,价格则是后者的一半。

OpenAI的团队成员展示了新模型的音频能力。OpenAI的研究(jiu)人员马克·陈说,该模型能够“感知你的情绪”。它可以分析用户的面部表情,并说出此人可能正在经历的情绪。

OpenAI还称,这个新模型最快能“在232毫秒内”对用户给出的语(yu)音提示做出反应,而“平均(jun)反应时间为320毫秒,与人类(lei)在交谈中的反应时间类(lei)似”。

发(fa)布于:北京市(shi)
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7