好奇 AlphaGo 用完了所有时间会有什么反应？

This topic created in 3760 days ago, the information mentioned may be changed or developed.

AlphaGo 对比赛时间有概念吗？会不会 AlphaGo 本身对时间无概念，赛方计算到时后直接忽略 AlphaGo 的后续动作？
如果要给 AlphaGo 添加时间相关规则，会不会让它在时间有限的情况下采取快速落子的策略，这算不算是一种 AI 「紧张」的表现？

alphago

赛方

落子

时间

8 replies • 2016-03-12 21:33:00 +08:00

kn007

Mar 12, 2016

...你没看第 2 场么？

alphago 消耗完 2 小时，有 3 次 60 秒读秒，他基本每 30 秒左右必下一步。

SilentDepth

Mar 12, 2016

@kn007 确实没看第二场。那这种时间有限的应对策略，是 AlphaGo 自己学习到的呢，还是科学家人为添加的规则？

Tink

PRO

Mar 12, 2016

有读秒的啊，怎么可能用完呢？进入读秒阶段机器人也是在 60s 内落子啊

zhujinliang

Mar 12, 2016

可能算法里带有时间预期判断，将耗时、剩余时间等也作为参数带入决策部分
实际表现看，像是人为地对参数进行调优，像 PBKDF2 似的，调整递归次数，将计算耗时控制在一定范围内
再者，进入读秒已经是中后盘了，计算量已经下来了

之前欧洲的比赛有提到，樊麾和 AlphaGo 除了常规比赛外，还下了 5 盘快棋，樊麾胜 2 盘

chlx

Mar 12, 2016

没有什么时间概念。寻找落子位置就是个优化的过程，时间少的话求解的结果就没那么好

chlx

Mar 12, 2016

也可以理解为时间是一个超参数，人为设置的。比如给 30s 让机器去优化， 30s 到了给出个当前最优解

wuhanchu

Mar 12, 2016

可能他有个清单吧，如果时间到没有更好的方案出来，就选择已有最好的方案。

chiangdm

Mar 12, 2016

我更好奇让两台 alphago 互搏是什么结果