人工智能攻克了围棋(最复杂的完备信息博弈)、《星际争霸》(非完备信息博弈的代表),下一步,机器博弈又会往哪里去呢?
博弈最初是对真实世界的抽象和模拟。中国象棋中有楚河汉界,这是对战争的模拟。围棋有361个落点,更是充满了无穷的变化。博弈最大的特点,是向后推演,考虑各种可能,以做出最好的决策。
生活中很多需要推演的实际问题,也可以分为两类,一种如围棋这样的完备信息博弈,有明确的规则。但更多的是另一种,也就是具备各种不确定性的事情,和非完备信息博弈类似。
笔者相信,机器博弈的未来,是把一些研究非完备信息博弈的思路,应用到实际生活中。如阿尔法星涉及的技术,可以用来解决其他问题,它的神经网络架构可以基于不完整的信息,对长时间序列中的可能行为进行建模。一局游戏通常长达一个小时并且涉及上千次动作。也许未来,这种方法甚至可以用来模拟自己的人生,帮助我们做一些人生重要关头的选择,比如高考之后填志愿。
高考之后填志愿的时候,其实需要考虑的因素非常多,包括分数线、学校实力、个人兴趣、职业规划等等,这里可以归为短期因素和长期因素。短期因素包括,要考虑到自己的分数能上什么样的学校、什么样的专业。长期因素包括,这个专业前景如何、自己是否感兴趣,这所学校是否适合自己,自己毕业后是否愿意定居在学校所在的城市……这样一来,需要考虑太多的因素。而我们现在做这些决策的时候,都是挑重要的点考虑,舍弃那些不重要的因素。
试想一下,如果有一个非常强大的博弈系统,帮你模拟做出不同选择,告诉你每种选择对应可能的结果,这样的系统是不是挺实用?除了模拟人生,金融市场预测、天气预报等,其实都可以看做一种基于不完整的信息,对长时间序列中的可能行为进行建模的应用。只是这些应用更加复杂,更加变化多端,更加不确定,也许是机器博弈未来可以尝试突破的地方,让我们拭目以待。
http://www.dashoubi.org/news/hqsy/2020-06-28/136545.html