(图片来源网络,侵删)
海花岛漫游日记最近中专女孩姜萍获得第12名全球数学竞赛的事成了热点,但今天我想说的是另一个话题:AI这次阿里巴巴全球数学竞赛首次向AI开放,共计有563支AI队伍参加,他们与姜萍一起解答同一份数学试卷比赛已经结束,但相关报道很少为什么?因为在6月13日公布的决赛名单中,801名晋级者里没有一支AI队伍入围,参赛的AI队伍最高分仅拿到34分,这个分数离决赛入围分数线还差了11分,而与第一名的人类参赛最高分113分相比差距更远AI队伍是如何参与数学比赛的?你可能也猜到了,就是给AI训练数学大模型这次拿到AI队伍最高分34分的队伍,它的思路与紧跟其后的AI队伍略有不同其它AI团队主要是输入不同数学解题思路和方法,或动态时时调整推理和验证步骤来训练AI系统而AI最高分得主则是给AI创建了自问自答的两个模型,让AI自己自行提出问题分析问题,最后选出最优答案这种方法让它拿到了AI队伍的数学最高分,确实非常新颖但从整体上看,AI数学的短板还是非常明显的因为无论是输入训练模型,还是输入让AI自己训练自己的模型,始终都离不开人类创造的自然科学,无法达到观察现实自然现象和逻辑推理的能力举个例子,牛顿的地球引力,AI数学能在没有任何数据和模型的基础上创造出来吗?还有爱因斯坦的光电理论,AI在虚拟世界如何去发现?早前AI数学解题唯一成功的案例是谷歌推出的阿尔法几何AI系统,但我觉得它所谓的"成功解题"不如说是"高效抄袭"当时的测试是从2000年到2022年奥数比赛中抽取30道几何题,AI成功解决了25道,而人类金牌得主平均解决了25.9道说实话,训练AI模型中如果曾经出现过这些题目,那当然可以"成功复述"一遍了,而这次还不是100%答对,其实应该算是失败的几何题目跟这次全球数学竞赛还有很大不同,这次数学竞赛有大量要求逻辑推理论证的题目,AI肯定就不灵了因为几何就跟下围棋类似,训练AI都是有清晰训练路径的,但逻辑推理论证题更多的是要靠人脑进行更加复杂的思考和分析推理看看姜萍在黑板上写的那些复杂的推理公式就知道,这可比几何图像和下围棋要复杂多了
0 评论