业界动态
马斯克最新预告!Grok1.5增强版下周上线,Grok2 将超过当前的AI?,模型,训练,上下文
2024-05-17 07:42:20
马斯克最新预告!Grok1.5增强版下周上线,Grok2 将超过当前的AI?,模型,训练,上下文

马斯克的大模型Grok,即(ji)将推出最新进化版——Grok1.5

而这距离Grok 1 开(kai)源仅仅才过去 10 天。

美东时间周(zhou)五,马斯克宣布,xAI公司最新的Grok-1.5将于下周(zhou)在他的社交媒体平台X上推出。

他表示,Grok 2 应该在所有(you)指标上都超过当前的 AI,现(xian)在正在训练(lian)中。

此前一天,xAI宣布Grok-1.5将在未(wei)来几天内提供给X上的早期测试人员和(he)现(xian)有(you)的Grok用户(hu)。

据(ju)介绍,Grok-1.5 推理能力大升级(ji),支持128k上下文长(chang)度。

其中最显著的改进之一是推理性(xing)能大幅提升它在编码和(he)数学相(xiang)关任务中的能力全面超越(yue)Grok-1、Mistral Large、Claude2。

在测试中,Grok-1.5在数学基准上取(qu)得50.6%的得分,在GSM8K基准上获得了90%,这两个数学基准涵盖了从小学到高中的各种竞(jing)赛问题。

从数据(ju)来看,Grok-1.5在GSM8K上提升到90,MATH上上升到50.6%。

在评估代码生成(cheng)和(he)解决问题能力的HumanEval基准测试中,Grok-1.5获得了74.1%的高分,超过了Claude 2的70%、Claude 3 Sonnet的73%、Gemini Pro 1.5的71.9%以及GPT-4的67%。

Grok-1.5 的另一个新功能是,能够在其上下文窗口内处理多达 128K token的长(chang)上下文。

这使(shi)得 Grok 的内存容量增加到以前上下文长(chang)度的 16 倍,使(shi)其能够利用更长(chang)的文档中的信息。

此外,新模型还可以处理更长(chang)、更复杂的提示,同时在其上下文窗口扩展时仍保持其指令跟随能力。

在NIAH评估中,Grok-1.5 展示了强大的检索能力,可检索长(chang)度达 128K 字节的上下文中的嵌入文本,并(bing)取(qu)得了完美的检索结果。

xAI 表示,Grok-1.5 构建在基于 JAX、Rust和(he) Kubernetes 的自定义分布式训练(lian)框架之上。该训练(lian)堆栈允许开(kai)发团队能够以最小的精力,构建想(xiang)法原型并(bing)大规模训练(lian)新架构。

为挑战OpenAI的ChatGPT,马斯克于去年创(chuang)立了xAI,并(bing)在去年底推出第一版聊天机器人Grok1。

本月早些时候,马斯克在起诉OpenAIde 几天后,宣布xAI将开(kai)源Grok。

xAI 表示,开(kai)源版大模型Grok-1是一个拥有(you) 3140 亿个参数混(hun)合专(zhuan)家模型,远超OpenAI GPT-3.5的1750亿。

这也是,目前参数量最大的开(kai)源大语言模型。

值得一提的是,距离Grok-1开(kai)源不(bu)到半个月的时间,马斯克又(you)火速放出进化版Grok-1.5。

这搞大模型的速度,马斯克也是出奇的快啊。

眼下,AI大模型竞(jing)赛逐渐白热化,大家伙(huo)儿眼看着都“杀红了眼”。

发布于:广东省
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7