人工智能能看几步走一步漫画下象棋(象棋人工智能几步能看下象棋)

图文原创：谭婧谭婧老师爱下象棋，就是谁也赢不了
去公园下了一盘棋，第一步我就走了一个当头炮，剩下的都是大爷们帮我走的
结果，我输了
经过他们的总结研究，我第一步走错了
2022年，象棋AI下棋机器人，问世了
我和它对弈了一盘，结果，我赢了
很有自知之明的我，严重怀疑设计者增加了噪音，降低了棋力
让我赢得很舒服
但我没有证据
怎么说呢，我就喜欢高情商的AI象棋机器人
低情商的机器人只会冷漠地碾压我：“下不过我，就别废话
”仿佛不仅嫌弃我棋臭，还嫌弃我话多
而高情商的AI象棋机器人，大为不同
它伸出胳膊，温柔地摆出“请”的姿势，它居然有机械臂
情商和机械臂都不是重点，聊聊它的智商从何而来
AI象棋机器人是人工智能技术中深度学习与强化学习的成果，击杀四方
任何人工智能都离不开数学基础原理，在此，首先得感谢尊敬的贝尔曼（Bellman）教授
以他名字命名的贝尔曼方程，在绝大多数强化学习的成果中都会用到，比如象棋AI下棋机器人的远方表哥，自动驾驶
它们是亲戚，“血缘关系”是“最优决策”
强化学习是要在多种决策中评价，找出好的决策
强化学习在象棋中，就是在多种走法中找到最好的走法
围观数学公式的人少，围观下象棋的人多
我们抛开公式，用决策树表示每一步的输赢，非常直观
一盘三十步的象棋比赛，会是一颗很大的决策树，有很多枝叶
计算机下象棋的棋力，早就超越了绝大多数的人
然而，至今没有任何一款计算机软件达到全知全能的“棋神”状态，连AI也不行
那在下象棋这件事情上，AI这几年在忙活啥？那要从几十年前讲起了
1980到1990年代，深蓝计算机是大公司的，小霸王游戏机是大家的
假如一个人类象棋高手下一步棋，能看未来八步棋
就好比一下能想到决策树上的第八层
传统象棋软件说，这我也行
话是没有吹牛，传统象棋软件确实可以做到
可是，再往前多算几步，所耗时间和计算存储可能都要翻倍
或者说，情况急转直下
在旧式象棋软件的时代，得想办法减少计算量
所以，有了阿法贝塔剪枝
这虽然有“偷懒”的嫌疑，但我也没有证据
阿法贝塔剪枝的方法，相当于提前知道哪些搜索是没有意义的，排除错误答案，用巧思“偷懒”，相当于省略做题过程
旧思路在象棋上还能支撑，用在围棋上力有不逮
（因为围棋是19×19的一个矩阵，每步可选择的走法要比象棋多一个数量级
）从旧式象棋软件时代，人们就为棋力算分
这是一个起源很早的好办法
那么得分是怎么来呢？用一个数学函数把有利赢棋的因素都考虑进去
以至于，中国象棋协会也有象棋大师用此来构思好棋
有了分数，僵化的下象棋，就是“哪步得分高，就走哪步”
然而，象棋是一个非常讲究全局观的游戏
追求最终取胜，不追求每一步占尽优势
比如，战术性丢车保帅
深度学习模型在象棋面前暴露了“缺点”，它算出当下局面的胜率，但是，并不能估算出后续局面的胜率
所以，需要一个重要的动作来加持：搜索
从决策树上理解，就是考虑的越多越好
如今，能搜索到决策树里非常深的层数，这就意味着，招数更多，棋路更多，对胜利的把握就越大
谈到如何处理搜索量大，就谈到了蒙特卡洛树搜索是学霸特供技能，对大多数人来说，都很难
甚至可以这样说，就是题目很困难，算不出来，只好求助于概率，求助于实验
一顿猛如虎的严谨分析算不出来
来吧，学霸直接撸起袖子做实验
蒙特卡洛方法的做法虽然看起来比较随意，但却有着坚实的理论基础：大数定律
在计算机眼里，棋子挪动一步，都算一个新的棋局，所以棋局数量何其之多
一个厮杀正酣的棋局，往后走，可能衍生出10000种棋局
借助蒙特卡洛树搜索这一方法，看未来几步怎么走
或者说，当AI象棋机器人，有了强化学习，就有了“大局观”
我们马上进入学霸区特供：《AI象棋机器人所用的蒙特卡洛树搜索》
这就是深度强化学习，模型收敛的目标是，把胜率估计越准越好
经过多轮训练，胜率会越来越准
胜率是AI象棋机器人的KPI，每下一步都估算胜率
每一步，尽量把胜率提高
常识是，高手胜率高，低手胜率低
问题来了，高到多少，低到多少
每一步的胜率很难准确估算，只能估大致范围
而且，把胜率提高的前提是，得把胜率算准确
在如此模糊的情况下，数据里会有误差
因为有误差，所以AI象棋机器人只能知道“棋神”的方向是什么，它想方设法逼近这个方向
象棋AI机器人的棋力水平的训练方法是，AI，加上蒙特卡洛树搜索，然后再教导AI本身
这个过程类似总结经验，这样使得它的棋力飙升
可以说，AI象棋机器人强大之处得益于蒙特卡洛树搜索
超越人类是很早以前的本事了，现在追求棋力丝滑上升，情商在线
让棋力水平菜，还有棋瘾的人，也能玩得开心（请不要在我下象棋的时候安装监控）
好了，这回就聊到这吧
看在象棋AI下棋机器人输给我的份上，我不妨透露两个消息
第一，有一版的AI象棋机器人初级棋力就打败了全公司的挑战者
大胜之际，算法设计工程师们哀嚎遍野：“大事不妙”
第二，我下赢AI象棋机器人那一局的时候，旁边有三个AI工程师帮忙出主意
（哦，第二点是在凡尔赛科技新媒体的日常）最后隆重介绍一下我们的全文审核专家：最后，再介绍一下主编自己吧，我是谭婧，科技和科普题材作者
为了在时代中发现故事，我围追科技大神，堵截科技公司
偶尔写小说，画漫画
生命短暂，不走捷径
原创不易，多谢转发还想看我的文章，就关注“亲爱的数据”