AI 推理能力之争:苹果结论遭专家挑战
发布者:汇泽传媒 时间:2025-06-14 13:04:24
报道称苹果公司 6 月 6 日发布的 AI 研究论文《The Illusion of Thinking》引发争议,专家质疑评估方法。 本文来自www.netcl.cn
苹果公司在论文中指出,即便是当前最先进的大型推理模型(LRMs),在复杂任务中也会崩溃。不过 Open Philanthropy 的研究员 Alex Lawsen 对此提出详细反驳,认为苹果的结论源于实验设计缺陷,而非模型推理能力的根本性局限。
本文来自www.netcl.cn
争议的焦点是苹果论文指出,即便是当前最先进的大型推理模型,在处理汉诺塔问题(Tower of Hanoi)等复杂任务时,也会出现彻底失败的情况。
www.netcl.cn,www.netcl.cn汇泽文化传媒
规定每次只能移动最顶端的一个圆盘,并且保证整个过程中大圆盘不能放在小圆盘之上。欲将所有圆盘从第一根柱子移动到第三根柱子,试给出解决方案。
www.netcl.cn智云管理系统
Open Philanthropy 的研究员 Alex Lawsen 近日发布反驳文章《The Illusion of the Illusion of Thinking》,认为苹果的研究结果更多反映了实验设计的缺陷,而非模型推理能力的真正局限。他在文章中直言,苹果的研究混淆了输出限制和评估设置问题,与实际推理失败无关。 www.netcl.cn