Google的新AI损害了56年来未解决的数学问题
栏目:专题报道 发布时间:2025-05-17 10:31
图片来源:Google去年,AI可以在医生的水平上解决数学问题是一个重大新闻。今年,可以在“未解决的奥秘”水平上解决数学问题的AI已经到来。 5月15日,Google DeepMind发布了新的编程代理Alphaevolve。与传统的编程代理不同,它专注于自动发现,并继续优化一般算法。顾名思义,Alphaevolve在找到更好的“进化”解决方案方面非常出色。它模仿了自然机制,并可以继续振兴和改变创新的代码算法。只要问题可以通过程序表达,并且可以通过操作评估结果,则alphaevolve可以重复该算法。 Google说,将其应用于50多个的问题之后,例如组合数学,几何,数量理论,Alphaevolve在几乎20%的问题中都比现有的人类解决方案更重要。 “ Alphaevolve在十几个公开发表的数学问题上取得了突破。但是对我来说,OST令人兴奋的是,在56年内,4x4复合矩阵乘法算法的首次改进。该结果来自一个复杂的搜索算法。”αevolve的价值不仅在数学中,而且显示了一般的“算法检测能力”。Balog说:“我们对Alphaevolve的应用只会触及表面。” 01问题可以在程序中表达出来。对于许多复杂的问题,其背后是一组自动进化机制,可以继续优化算法并改善Alphaevolve的本质上。ugh提示采样器(提示采样器),并指导语言模型生成代码。 DeepMind与两种不同的双子座模型结合使用:Gemini Flash以更高的速度产生大量候选者,从而扩大了思想程度。 Gemini Pro提供了更深层的结构建议。两者的组合将纳吉特(NAGIT)提供给模型,以生产具有可行性和算法深度的程序。生成的程序将发送到自动审核系统,并在验证,操作和标记后写入程序数据库。在数据库中运行的一组进化算法将从现有程序中选择最佳的功能解决方案,为下一个信号旋转提供方向,并继续阻止产生更好的解决方案。 Alphaevovle的主要要点之一是设置Itaaktomical检查指示器。它可以验证,运行和评分发电机。每个程序将通过H测量在诸如准确性,操作效率,代码质量等测量中的功能。图像来源:Google,此处的H功能仍由人类研究人员定义,并且可以划分是测量值的组合,例如准确性,运行时,甚至可以读取代码的能力。 Alphaevolve负责在给定h的前提下找到最佳f。对于某些数学问题或研究活动,Google也可以预设h。它还描述了alphaevolve的当前边界:这适用于“如果结果很棒”可以自动计算并判断的问题。但是如何定义“伟大”仍然需要给予。当涉及人类实验需要确定是否良好的问题时,Alphaevolve不会审查它。以DeepMind研究人员提到的4 x 4复杂矩阵复制为例,研究人员设定了一组任务目标,包括最小数量增加(即张量衰减的等级)和T的随机比率他播种以实现这一结果。这些信号构成了Alphaevolve优化的目的,引导它们在复杂的搜索空间中不断“攀爬”。 alphaevolve已根据共同的梯度优化过程(包括初始化,重建损耗功能,ADAM优化器等)更改了一系列高质量张量算法。最终,在14个基质繁殖结构中,它是最佳的最佳结果。最引人注目的事物提出了第一种历史算法​​,可以使用48次复制品完成4×4复杂矩阵复制的算法 - 删除了56年来未损坏的记录。图像来源:可以将GoogleAlphaevolve的技术途径监视回到早期的Funsea Systemrch提议的深媒体。 FunSearch还使用语言模型来指导程序的演变,并用于发现数学结构或在线算法技术。但是与此相比,AlphaevolvE可以显着提高可扩展性:它可以更改完整的程序来处理优化合作的许多功能,组件,甚至是跨语言结构,而不仅限于单个Python函数。这种较高的灵活性不仅会产生Alphaevolve,不仅是“智能的更改工具”,而且可以使这样的“编程合作伙伴”能够团结起来更改大型算法系统。根据DeepMind的说法,Alphaevolve应用于50多个数学问题,涵盖了数学考试,几何,组合数学和数字理论等领域。大多数实验可以按时部署。在大约75%的问题中,它成功重新定义了当前的最佳解决方案。令人惊讶的是,大约是20个问题,它提供了比知名方法更好的解决方案。例如,在数学社区中研究的“数字接吻问题”已有300多年的历史中,Alphaevolve建立了一个由593个领域组成的新结构在11维空间中降低较低的键。除了数学外,Alphaevolve还在Google上实施了计算堆栈中许多级别的工程问题,包括:为BORG系统设计新的启发式安排;练习大语言模型时使用的矩阵繁殖的内核;在TPU芯片中重新写入Arithmetic电路;并加快实施变压器注意机制的速度。这些任务的跨度很大,但是它们都有一个共同的功能:问题可以通过程序表示,结果可以通过操作评估。只要这两个点是真实的,alphaevolve就可以起作用。 02智能供应带有无限的游戏。该版本来自Google DeepMind。该小组已经启动了地标AI系统,例如Alphago和Alphafold,这些系统大大扩大了情报游戏领域和发现科学领域的人工智能边界的边界。与依赖的系统不同关于自尊和自我游戏研究(例如Alphago),Alphaevolve通过Wi Modelsyou产生了大量的程序候选者,并结合了自动检查和进化机制来筛选更好的算法解决方案。它类似于可易和可扩展的算法结构和发现框架。与Alphago相比,在规则明确定义的游戏中,人工智能的重要性可能更多的是,人工智能的重要性可能更多:它为研究人员提供了连续且测量的算法和优化能力的研究人员。算法的设计和调音始终是非常困难的技术能力。算法工程师通常对工作市场中较高的工资阈值和职位感到满意,这足以表现出其复杂性和缺乏症。现在,只要您设置了一种清晰的审核方法,Alphaevolve可以自动galugarin并优化具有接近无尽功率和PAT的算法解决方案我这意味着曾经依靠个人经验的“发现和改善算法”的能力开始从困难,手动和无法解释的变化转变为基于智能供应的自动和规模。尤瓦尔·哈拉里(Yuval Harari)有一个比喻来描述alphago对人类带来的影响。人们正在探索如何扮演行星,人们将继续绘制路线图以探索行星的外观。直到AI似乎人们才意识到他们只是在Go星球上的一个小岛上漫游,而真正的星球宽广,他们没有进入的地方不仅仅是想象力。从去年到今年,在科学研究领域,我们还继续看到AI在做同样的事情。 2024年,与AI相关的成就首次获得了诺贝尔物理和化学奖,这很可能是未来科学研究的标准。在某种程度上,Volve制作了字母以加速以空前的速度呈现科学研究的“未知地图”。在无尽的智能供应中,每个字段都倾向于重新探索。当“发现算法”不再稀缺时,人类知识的旅程可能已经开始。
服务热线
400-123-4567