2025-11-20 06:26:48
阿尔法狗能赢是因为它用了很多数据和特殊方法学围棋。它先看人类高手下棋,再自己模拟上百万局比赛,这样它就比人类更懂围棋的规律了。
它用的办法分两步走。第一步叫监督学习,就是喂它看十万个高手对弈视频,让它知道怎么下棋。第二步叫强化学习,自己开房间和不同对手打,输了的局会自动调整策略。比如在2016年,它用这种办法训练了三周,每天算力相当于三万台电脑同时工作。数据证明,它学完的棋力相当于人类顶尖选手九段水平,但胜率比他们高30%。比如和李世石对弈时,它有37步棋的决策比人类快0.5秒,而且每步棋都精准计算了后续200步的变化。这种训练方式让它在复杂局面下总能找到最优解,比如第四局第37手“神之一手”就用了新发现的定式。
本题链接: