Navigation menu

新闻中心

年率超过20,000!马斯克(Musk

面具已经握住了将近六个月,因此终于将Groke 4带到了桌子上。这次,他的语气仍然很好。在新闻发布会之前,他发表了一份艰难的声明,声称Grok 4“想重写人类知识基础”。关于新闻发布会,马斯克再次强调,Grok 4目前是世界上最聪明的AI。是的,家庭口味,家庭食谱。当然,毫不奇怪,面具很长一段时间来赞美自己的产品,但是随着互联网用户的开玩笑,他们可以嘲笑Xai员工睡觉和工作,直到周末的4:20 AM。如果Grok 4值得获得“聪明”的标题取决于他未来的现实生活经验。但是,有一件事您无法逃脱。它将成为市场上最昂贵的AI,年度订阅价格高达3,000美元,其价格策略几乎没有道德。最直率的世界?世界上最昂贵的人工智能! Grok的训练路线分为TWo中心阶段:在加强培训和学习之前学习。从Grok 2到Grok 3,预训练方法主要取决于。 Grok 3的Grok 4更新显着引入了强化学习训练,并以核作为核的推断能力。面具轻轻地说,但训练并不小。与Grok 2相比,Grok 4的训练计算量增加了两个数量级,这对应于100倍,但仍在扩大。马斯克说,在所有主要领域,Grok 4都高于博士水平。目前,我们没有能力发明新理论或提出原始技术,但这似乎只是时间问题。他说,Gock可以在今年年底发明新技术。明年,几乎可以肯定的是,它将有能力发现新的物理定律。当然,真正的关键是将AI与现实世界联系起来。他说,Grok和类人形机器人Optimus的组合形式闭路推理系统,提出假设,假设并探讨现实。这是人类历史上最激动人心的时刻,因为这是智慧爆炸的时刻。这是一个节点。就产品格式而言,Grok 4是单个代理模型,而Grok 4重量是多种代理的版本。第一个很容易理解,而第二个则承认多个代理商在推理过程中进行水平调整并调用大量计算机资源以完成更复杂和复杂的任务。在现场演示期间,Grok 4剧烈展示了场景的多种特征。例如,预测Grok 4 Gray今年赢得世界系列MLB的机会。我们评估赢得洛杉矶道奇队21.6%冠军的机会,并在4.5分钟内产生预测过程。此外,例如,看似毫无用处的任务:在XAI团队中找到最奇怪的任务。信任平台X的数据库,S模型会自动徘徊,分析Avatar的样式,并最终被Co -Indounder Greg Yang阻止。有趣的是,该模型可以准确地理解“奇怪”的主观概念,并在湿滑的演示中进行相似类型之间的相对判断,但是似乎人类员工的化身正在研究Jan Leike,并且必须提高精度。除了推理和搜索外,Grok还可以生成内容时间表。例如,您可以组织参考测试的结果,制造商更新节奏以及基于平台X平台的公共出版物中多种模型的社区响应。用户可以清楚地看到OpenAI分数的性能,Gemini的更新和迭代,甚至模型之间的微妙竞争竞赛。换句话说,Grok不是只知道考试的书呆​​子,而是真正能够理解和执行间隔的AI。目前,格罗克的最大弱点仍然是专注的D关于他的多模式理解能力理解和生成图像,这必须改善。好消息是,下一个基本训练阶段已经在进行中,预计将在几周内完成。在演示期间,在测试“两个黑洞的碰撞过程”的可视化任务时,Grok采用了牛顿方法的简化计算方法,而不是完整的相对论一般理论。后备军。尽管简化了,但该模型仍然提出了黑洞合并的重要物理阶段,例如“螺旋接近”,“融合”和“邮票阶段”,并且可以清楚地解释所使用的近似方法。此外,还调用了相关的教科书,公共搜索结果和真正的推理支持物理常数,并且一般逻辑链严格且清晰。至于纸张参数,Grok 4也提供了很好的响应。对人类(HLE)的最后一次检查涵盖了100多名受试者,包括数学,物理学,计算机科学,医学,人文科学和社会科学,共有2,500个封闭式问题。该测试非常困难,可以真正反映模型在常识和复杂推断中的组成性能。根据XAI数据,Grok 4无工具赢得了25.4%,超过Google Gemini 2.5 Pro 21.6%和OpenAI O3(高端版本)。使用该工具,Grok 4重获得了44.4%的得分。使用该工具后,Gemini 2.5 Pro的26.9%高度高。在总体趋势中,Grok 4不仅提高了复杂任务的处理能力,而且逐渐降低了模型和一般意识的智能,同时扩大了培训资源。之间的差距。非营利性弧奖还指出,Grok在ARC-AGI-2测试中建立了新的记录。这是一个视觉推断参考测试,AI需要识别图像中的模式。 Grok获得了16.2%,几乎是当前作品4的两倍。定期参考测试,Grok 4的重得分几乎是“完整的”。在博士问题中,我建立了一个GBQA,但总的困难略低于HLE,但是重的Grok 4仍然达到完整的成绩,并显示出强大的推理和理解技能。不仅如此,在与编程有关的许多测试中,Grok 4重量的性能也引人注目。实时编码,HMMT(麻省理工学院数学竞赛)或USAMO(美国数学的起源)(MPIC)或远远超过了第二名的当前模型,其技术优势非常明显。此外,对著名分析机构的人工分析评估了许多与推理相关的七个参考点的常规模型的积分性能(MMLU-PRO,GPQA钻石,对人类的最后一次检查,Livecodebench,Livecodebench,Science,Aime,Aime,Math-500)。根据数据,Grok 4首先以73分进行了分类,目前是具有最高INTE的模型推理能力的GRAL分数。 O3-Pro(估计值)为71点是O3-Pro。马斯克还强调:“将来,Grok几乎在所有考试中都会正确回答所有问题。如果您无法回答一个特定的问题,请指出问题中的错误或指出问题的歧义性的歧义,传统考试将失去含义。AI的目前进度很快就会过时,因此它会尽快更新,因此它会尽可能多地更新。目前,Grok 4和Grok 4重做了,它已成为许多用户投诉的重点。安全栏杆以及机密或非法信息输出。学习整合武器,完成《星球大战》 1脚本(版权怀疑),甚至勒索软件(恶意软件代码)。 Grok 4还朝着“人类”的主题迈出了重要的一步。与我们知道的语音助手不同,Xai的新声音助理“ eva”可以OT只回答,但也表达情绪,改变他们的声音,甚至在行为中“唱歌”。在现场示范中,我们有一个即兴的色情色素“ Diet Cola咏叹调”,英语声音“饮食尾巴”,您是神圣的长生不老药...”。现在,音频模型发行了五种声音,包括盐,“电影预告片中的男性声音”,它打开了现场传输和五种声音,包括夏娃,后者承认低潜伏期,自然的停顿和情绪低落。比较的演示也与Chatgpt的声音一起放置,并且都谈到了数字。 Chatgpt是一个“快速的答案”,作为同学坚持不明确聆听的同学。 Grok提供较柔和的性能,更接近人类的语音习惯,并且不会中断用户。新闻发布会说,自配音模型启动以来,Grok Voice的末尾已经增加了两倍,活跃用户也增加了10倍。格罗克的声音正在迅速增长。马斯克:打开一个mi印象深刻llion自动售货机在Groke中赚钱。 Grok 4 API的应用程序方案令人印象深刻。例如,在银行出售自动售货机业务模拟,要求Grok独立完成。供应商谈判,库存管理,价格策略,持续完成和长期盈利能力。 ▲注意:自动架基础是测试基于LLM的代理的专业设计,它是管理简单但长期的商业场景的能力:自动售货机的运行。测试结果表明,Grok 4不仅优于分类,而且还获得了其他模型的两倍。甚至马斯克都说:“格罗克将来可以退还钱来购买图形卡,以展示和操作一百万台自动售货机。”在科学研究领域,Grok 4用于CRISPR遗传研究和胸部X -RAR分析。您可以在几秒钟内阅读数百万个实验记录和记录更有可能成功的过滤假设。此外,可以通过API XAI使用GROK 4来实施金融和游戏开发等项目。在新闻发布会上特别提到了游戏设计师。然后,我只花了四个小时才能创建一个第一个射手。 Grok 4还没有结束。新闻发布会最终获得了下一个路线图,每篇文章都在等待它。代码模型:这次Grok代码没有启动,但Xai表示经过培训,并且将在几周内启动“快速且智能”的代码模型。多模式特征:Grok 4仍然对图像的理解表现有限。该团队还表示,他们正在训练下一个比例版本,并希望导致对图像,视频和音频的理解进行定性变化。那时,戈克可以“看到人类世界”。视频生成:XAI表示将使用大量的计算机资源来培训视频生成模型。它的最终目标是生成视频并生成互动的“无限视频传输,以便用户可以在观看时参与情节。这本新闻发布会上可能有两个家庭面孔。他们是Xai-Jimmy ba and Yuhuai Wu的共同创始人。在其中,Yuhuai Wu毕业于新的Brunswick Univers of New Brunswick,在加拿大的大学中毕业了一名自动培训,该学位是一家自动的,并在一家医生中毕业了一家医生和一家医生。 2021年。在此期间,他与杰弗里·辛顿(Jeffrey Hinton)一起学习,他在他的博士学位上也花了很多时间,在毕业后,他在Google上工作了,并在斯坦福大学的博士后工作。 Alpha的机制形成了定理,并在主要杂志中发布了他的文档杂志是在数学推理的坎波中促进人工智学进步的“自然”。 ▲吉米·巴(Jimmy BA)(左第二)和吉米·巴(Jimmy BA)(左侧第三)坐在他旁边,是纽约大学计算机科学系的助理教授,在他的博士学位期间是吴的导师之一。它来自Hinton,是深度学习训练优化领域的关键人物。最著名的是,他和他的合作者提出了Adam Optimizer(自适应时间临时优化器)。现在是用于训练深神经元网络的预定算法。可以说,他的博士学位论文为现代AI培训机制树立了可靠的理论基础。我不得不说戈克4已经正确到达。上一代Grok 3的受欢迎程度变得非常快,快速退休。截至5月9日,Grok的流量在3月增加了超过100万次,降至5,200%,根据Tente Report2025的总体生成性世纪RY,由著名的市场分析机构Sigrayweb出版。与上一代匆忙释放的节奏相比,我们急忙发表论文,但是这次Grok 4显然放慢了脚步,并为抛光产品而付出了更多的努力。归根结底,火星Grok的Halo帮助Grok带来了第一个交通浪潮,但他可以根据模型本身的强大力量来保持用户。但是,当马斯克在Grok 3中扔掉它时,我记得它了。他承诺开源Grok 2。看到五个月过去了,问题没有转移,也没有在此新闻发布会上提到一个单词。老挝,您不能比严格训练和对待他人更慷慨。作者:张郑,Mo Chongyu
上一篇:Operai推出了最强的GPT模型 下一篇:没有了