业界动态
像真人一样聊天,ChatGPT向AI助理更进一步|新京报快评,模型,用户,进行
2024-05-17 05:17:10
像真人一样聊天,ChatGPT向AI助理更进一步|新京报快评,模型,用户,进行

▲ChatGPT的(de)本次升级,意(yi)味着“AI助理”的(de)技术竞争开始(shi)进入了(le)新的(de)阶段。图/IC photo

据媒体报道,北京时(shi)间5月14日凌晨,OpenAI在春季发布会展示了(le)ChatGPT的(de)更新功能。这些功能主要集中在用户的(de)交互体验上,用户可以通过文本、音频(pin)、图像等任意(yi)方式进行组合输入,并得到ChatGPT的(de)实时(shi)回复响(xiang)应。

在现场演示中,OpenAI重点展示了(le)实时(shi)对话交互和语音多样化的(de)功能。现场展示显示,ChatGPT不仅可以像真(zhen)人一样语音聊天,还可以根据用户需求,识(shi)别和模拟不同(tong)的(de)情(qing)绪、语调进行输出。

此次升级尽管不是参数或算力上的(de)重大(da)前进,但其在用户体验尤(you)其是使用门槛上的(de)价值仍然不容小觑。

OpenAI的(de)CEO山姆·奥特(te)曼将本次更新总结为“人类级别的(de)响(xiang)应”。从使用体验上看,使用大(da)模型的(de)场景(jing)将变得更像是与“智能助理”进行对话交互,你可以用语音、文本等综合方式不断(duan)提出要求,并得到即时(shi)的(de)答案回复。

例如,此前如果你希望通过ChatGPT来帮忙做数学题,那么,用户需要做的(de)步骤有:打开ChatGPT,以文本形(xing)式复制题目(mu),等待ChatGPT响(xiang)应,得到完整答案。如果希望听到有步骤的(de)语音讲解,则(ze)需要等待文本答案全部生成之后,再发出新的(de)指令。

而(er)随着此次交互升级之后,这一体验被改进为了(le):用户正常在电脑上做题,需要询问的(de)时(shi)候,直接语音或者让ChatGPT根据当前屏幕(mu)内容进行解答,而(er)ChatGPT则(ze)会根据用户做题场景(jing)的(de)需求,进行步骤引导(dao),而(er)不是直接给出答案。

如果你正在使用书本做数学题,则(ze)可以打开设备的(de)摄像头,由ChatGPT通过摄像头看见的(de)内容来完成解答。并且(qie),中间用户可以随时(shi)打断(duan)ChatGPT进行提问与交互。

本次ChatGPT的(de)体验升级,主要是围绕人类信息交互的(de)核(he)心场景(jing)与方式来进行。人类日常信息输入的(de)主要方式是“观看与听说”,而(er)信息处理的(de)主要方式是“逻辑与情(qing)绪”。因此,新升级后的(de)ChatGPT重点加入了(le)“观看屏幕(mu)”“情(qing)绪模拟”等功能,以适配于人类日常的(de)交流习惯。

过去基于特(te)定(ding)任务指令而(er)出现的(de)生成性交互,仍然只是大(da)模型应用于特(te)定(ding)生产场景(jing)的(de)初步尝试。大(da)模型如果要真(zhen)的(de)进入人类生活,模拟人类信息交互的(de)真(zhen)实场景(jing)与逻辑则(ze)是必需的(de)关键一步。

在关于“人工智能”的(de)诸(zhu)多想象中,不管是文学作(zuo)品还是科幻电影,都(dou)默认人工智能是“使用人类交互形(xing)式来沟通”的(de)信息处理助手。这次实时(shi)语音交互功能的(de)加入,毫无疑问使得大(da)模型的(de)使用体验更加符合人们对一个“人工智能助理”的(de)期待。

模拟人类日常生活场景(jing),实现“所见所得”或语音实时(shi)交互,已经成为当下大(da)模型行业的(de)重要升级方向。不久前,Meta(美国互联网公司,原(yuan)名Facebook)发布的(de)第二(er)代人工智能眼镜,同(tong)样也实现了(le)利用摄像头传感器,对用户所看到的(de)一切(qie)进行实时(shi)的(de)交互、翻译等功能,从而(er)一跃成为了(le)广受欢迎的(de)智能硬件。

设想一下,如果大(da)模型可以“看到人眼所看到的(de)一切(qie)并随时(shi)给出答案”,或者可以“随时(shi)听懂你要问的(de)问题并随时(shi)给出答案”,甚至可以“读懂你当前的(de)情(qing)绪并根据你的(de)情(qing)绪提供答案”,那么,大(da)模型就离人们设想中的(de)“生活助理”的(de)功能不远(yuan)了(le)。

从颠覆性的(de)角度(du)看,大(da)模型除了(le)在作(zuo)图、作(zuo)曲、数据处理等生产领域(yu)发挥特(te)定(ding)作(zuo)用之外,更大(da)的(de)挑战任务,是进入公众的(de)日常生活,真(zhen)正成为每个人的(de)“生活智能助理”。如果大(da)模型可以承接住用户日常生活中绝大(da)多数的(de)信息检索、处理、决策,我(wo)们刚刚熟悉的(de)商业世界、技术应用也将随之发生巨大(da)变化。

此前,微软尝试将Copliot融入Windos11,谷歌和亚马逊也正在尝试将自己(ji)的(de)大(da)模型融入到系统与产品之中,这些动作(zuo),都(dou)是在争夺用户“AI助理”的(de)入口(kou)。而(er)ChatGPT的(de)本次升级,意(yi)味着“AI助理”的(de)技术竞争开始(shi)进入了(le)新的(de)阶段。

或许(xu)很快,大(da)模型将不再是一个只有少数人或特(te)定(ding)行业使用的(de)生产力提升工具,而(er)将迅速成为普(pu)通人日常生活的(de)重要助理,并最终成为公众日常信息交互的(de)主要入口(kou)。

撰稿 / 马尔文(媒体人)

编辑 / 迟道华

校对 / 李立军(jun)

发布于:北京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7