棋新闻

线预约

(*请输入正确的信息,进行零基础免费试听课在线预约,我们会及时进行电话回访!)
  • 姓    名:
  • 年    龄:
  • 电    话:
  • 验 证 码:

系我们

陈瑞围棋道场
天大部:天津大学新体育馆A区1楼
南开部:南开区迎水道阳光家园二楼
电话:022-27407786 18920312553 (周一公休)
新浪博客:blog.sina.com.cn/chenruiwqdc
搜狐博客:chenruiwqdc.blog.sohu.com

棋新闻

当前位置:首页→围棋新闻→最新报道

余小鲁:围棋彩票在人工智能背景下的发展研究

浏览次数:87次 发布时间:2018-10-10

  文章来源:公众号  杭州棋文化

摘要:受最近韩国“重启围棋彩票案”的启发,本文重点研究围棋彩票赔率的设置,从庄家和玩家两方面来讨论围棋彩票的科学基础。并以实际对弈平台的具体例子,来建立模型展开量化的研究,为进一步用大数据人工智能机器学习打下基础。最后展望了我国未来围棋彩票业的可能发展。

一、研究背景

Alpha Go的出现,对围棋在某个局面下,黑白双方的胜率有了极为精准的判断,这是在人工智能发展史上一个划时代的成就。但对于将要进行的某场围棋比赛,双方胜率的预测,Alpha Go却无能为力。本研究基于职业围棋大数据和全历史排名算法(Whole HistoryRating,下文简称WHR),利用人工智能机器学习的方法论,对围棋比赛双方的胜率做出科学的预测。

人工智能的高速发展,在博彩业的各个方面都有了精准的预测和赔率。近年来,随着围棋比赛的高度商业化市场化,对于围棋比赛结果的科学预测,将会有广泛的市场意义,并将进一步推动围棋的大众化。国家体育总局发行的体育彩票,以足彩为例,也是基于对足球比赛结果的科学预测。同样的道理,围棋作为一个历史悠久的体育项目,如果能对比赛结果有科学的预测,能够为广大围棋爱好者提供合理的赔率,围棋彩票在未来将成为可能。如在今年的7月19日,韩国的曹薰铉议员出席棋士会为“重启围棋彩票案”。会议的议案有两则,一为“是否重新启动围棋体育彩票事业”,一为“是否把伦理委员会更名为赏罚委员会”。经四个小时的会议,“重启围棋彩票案”101人投赞成票、59人投反对票,议案获得通过。“伦理委员会更名案”90人投赞成票、67人投反对票,议案亦获得通过。对于这个“重启围棋彩票案”议案,韩国职业棋界毁誉参半,赞成的说“考虑到周边棋士们平素的氛围,议案获得通过是早已预见到的结果。现在围棋界连棋战都维持不下来,所以需要’彩票’的胜负手。”反对的说“氛围上大致预想到赞成票会更多一些,但没想到赞反的票数差距会这么大。我怀疑韩国棋院执行部能否有效杜绝围棋彩票带来的副作用?同时我也希望今天投赞成票的棋手们苦心思考这个问题。”

本文不考虑现实制度问题,先从学术层面上研究,影响一场围棋比赛结果的场内场外因素非常之多,有诸多偶然性和随机性。对围棋比赛结果的科学预测,将会是人工智能机器学习的一大挑战和新的机遇。

二、方法论

对于围棋比赛结果预测,人工智能机器学习采用的范式为监督学习。每场围棋比赛都只有两个结果(没有平局,三劫循环无胜负的情况极少)。监督学习就是让计算机在围棋比赛历史数据中找出科学的规律,其中最关键的就是要提取出影响围棋比赛的主要因素,称为特征。从特征到历史数据中有标记的结果(谁胜谁负)存在着一种多元复杂的函数关系。监督学习的方法,就是要有效的近似这个未知函数,才能对未来的比赛作出合理的预测。

影响一场围棋比赛结果最重要的特征当然是围棋选手自身的实力。那么围棋选手自身的实力该如何量化的体现呢?古老的段位制度是一种粗糙的量化方法,已经完全不能满足现代围棋比赛预测的需要。WHR的方法,考虑了所有选手之间的对战成绩,对选手的实力采取动力学更新的Bradley-Terry模型再加上贝叶斯概率推断的修正,非常有效的概括了围棋选手的实力。那么我们研究思路选取的特征第一个就是比赛双方的WHR分数。再结合以下六个特征:1。双方年龄。2。比赛用时(快棋/慢棋)。3。比赛奖金。4。选手性别(男/女)。5。最近12个月双方交手的历史战绩。6。主客场。

从特征到结果的对应,我们将训练神经网络分类器(二元分类)。把围棋比赛历史数据随机拆分成为以下三块:1。训练集(占60%)。2。 交叉验证集(占20%)。3。预测集(占20%)。 最后算法预测的准确率,由其在预测集中的表现来判断。

训练完成之后,对于将进行的每一场围棋比赛,只要输入双方的WHR分数,和上面所述的六个特征参数,即可以输出机器学习所得到的预测结果及其对应的概率。更进一步的,可以把以上机器学习的过程整合成为一个界面友好的APP,方便展示和广大棋友的使用。

在全面开展人工智能研究之前,为了更好理解围棋比赛的预测押注策略,我们下一章先以弈城押分为例,建立一个预测的玩具模型(toymodel)。在此必须强调的是,这个玩具模型用的是第一性原理的方法。第一性原理对待围棋,就是从围棋的胜负规则和死活规则开始研究围棋,不是从布局理论定式来开始研究。布局理论定式这些威力非常的大,但不是第一性的,是从围棋的胜负规则和死活规则自然演绎出来的。围棋的第一性原理,就是气尽棋亡。直接的推论,就是气要不会尽,大多时候需要有两个眼。然后就开始研究如何容易有两个眼,如何围空效率高。中国古人的围棋理论非常高明,清代施襄夏的总决开篇第一句,起手据边隅,逸己攻人原在是。这个理论要解释围棋布局起手为什么是下在边角上,是因为自己容易活(逸),容易活的地方被你占了对手就不容易活,叫“逸己攻人”,过了三百年,现在巅峰造极的阿尔法围棋,依然是起手据边隅,这就是理论思考的力量。接下来第二句叫入腹争正面,制孤克敌验于斯。必须注意,这就不是第一性原理的直接推论了,所以开始模糊,理论开始变得“危险”。因为人为定义了一个概念叫“正面”,进入围棋中腹的正面究竟是哪一面?但这个理论依然威力非常强大,顶尖高手心中都有正逆向背的概念。但入腹争正面只能称之为一个假设,也许是一个非常好的假设。下面一章就是只用了一个假设,初步的研究围棋彩票。

三、玩具模型——以弈城围棋押分为例

对棋赛的预测,整体上说有两大流派。

第一是基础分析,就是用种种参数来刻画棋手的真正实力。比如说,棋手的等级分就是一个重要的参数。等级分高的棋手占优势,这是一个统计判断。机器怎么看棋谱,其实也是一个大问题。我们可以直接对棋盘拍个照片,发给机器,让它去看去图像识别,但这样信息量太大。因此我们回过头来思考,人是怎么样看围棋的某个局面的?我们创造了一些概念,看谁厚谁薄,看谁空多谁空少,看谁有孤棋的负担等等。但适合人的概念未必适合机器。机器需要可以量化的特征。举个例子,阿法围棋看棋谱,一个重要的特征就是气。棋盘上每一块棋每一时刻的气,都要当成一个特征输入参数。机器看一张棋谱,看到的就是类似于气这样一个个的数值参数。人脑对于概率性的判断有很大的缺陷,从进化论的角度讲,从原始人进化到现在,并不需要我们学会区分75%和80%的事件,所以我们大脑一直没有进化出来这部分的能力,机器学习在这方面的优势是压倒性的。让机器集中分析棋赛的基本面,认为这个基本面可以对应到真正的胜负概率,也就是赔率真实价位。对照庄家开出来的赔率,从而找出被低估的价格。

第二是技术分析,出发点是认为你能搜集到的资料,市场已经帮你分析好了,已经全部消化在棋赛的价格之中。棋赛的价格,也就是相应的赔率,包含了所有必要的信息。这个赔率的波动,包含着整个市场所有棋迷的真知灼见。人工智能只需集中分析价格波动的曲线,从中找出和棋赛结果某种相关性就已经足够。也就是说找到被低估的价格,来作为你的投机对象。

此章的玩具模型属于第一种方法,基础分析。但预测棋赛需要满足一个大前提,就是预测者本身是不懂围棋的。就是说不能根据棋的本身来预测棋的结果。举例说,如果是柯洁来预测棋赛,他可以先看完布局进程,在第二阶段才开始押注,因为他有能力做出细致的专家判断。此章所述的方法是统计性质的预测,适合于机器的预测,不是人为的预测。

以弈城对弈平台为例,第一步先要弄清楚围棋赔率(平台上显示为“分配率”)的意思。以一盘具体的棋赛为例,平台显示黑白双方的分配率为(如下图)


意思是我们投注一万弈币在黑棋,如果黑棋获胜,我们净赢28000。我们投注一万弈币在棋,如果白棋获胜,我们净赢2000。无论是围棋彩票,还是平台开出来的赔率,其数学原理是一样的。我们第一步要研究此赔率是否公平。公平之意,就是庄家没有抽水,玩家存在着不败的玩法。数学上双方统计是个和局。我们在此避免用严谨的数学,先用大白话来说明:

我们同时在黑棋上投注一万二,在白棋上投注三万八,那么我们的总投入是五万。无论结果是黑胜还是白胜,我们的收入是3.8*1.2=4.56,即我们总收入是四万五千六百。统计上我们平均每次损失1-四万五千六百/五万=8.8%。也就是说,庄家的抽水率为8.8%。抽水率其实就是庄家长期统计的盈利所得,这个数字的高低直接决定了其盈利的高低。当然对于不同的彩池制度,还有些重要的区别,这点留在最后一节补充说明。

作为一个最简单的玩具模型,我们预测棋赛的结果,唯一需要用到的信息是对局双方跟同段位对手的前二十局历史战绩,也就是对弈平台自动提供的统计结果。对局平台的规则,是在同等段位玩家之间的封闭“联赛”,前面二十局的战绩是一个很好量化棋手真正实力的指标。根据黑白双方的这个指标,我们可以简单用概率论公式估计对战双方的胜率,具体实例如下图

图表中黑棋战绩意思是,执黑者前二十局的
图表中黑棋战绩意思是,执黑者前二十局的胜局数,白棋同理。

黑棋理论胜率的概率论估计公式为:

黑棋理论胜率=(黑棋战绩−黑棋战绩×白棋战绩÷20)÷(黑棋战绩+白棋战绩−黑棋战绩×白棋战绩÷10),同理

白棋理论胜率=(白棋战绩−白棋战绩×黑棋战绩÷20)÷(白棋战绩+黑棋战绩−白棋战绩×黑棋战绩÷10)

两者之和:黑棋理论胜率+白棋理论胜率=1

科学的投注方法分两步,第一步是根据平台给出的即时赔率,找出具有正期望值的投注对象。上图中房间号为124的棋局,无论投注黑棋和白棋,根据我们的模型,期望值都为负数,即玩家不能投注此棋局。房间号179的对局,可以投注黑棋胜,其正期望值有4.69%。

第二步是投注量的问题,假设我们的总资本是一千万弈币,我们在179房间应该下注黑棋多少弈币呢?也许这么说就明白了。预测棋赛的结果像围棋的布局,很难完全科学化,还有“艺术”的成分。但如何投注像围棋的官子,是完全可以量化科学化的。基于人工智能的预测结果,如何投注可以有一个完善的科学理论。这个理论是独立于人工智能存在的,是人的智慧,不像人工智能是一个黑匣子。主要根据是马克维茨的投资组合理论和凯利(JohnKelly,贝尔实验室的物理学家)的投注判据。简单的说,凯利判据是基于正期望的前提下,如何决定我们的投注额度。但很多场棋赛同时进行,每场棋赛预测的准确度和对应赔率都不同,这时候需要决定具体的投资组合。即使我俩相信同样的预测,但我俩的有效资本不同,风险偏好不同,对投资组合的最优化也是不同的。

抽象的谈理论有时容易误导,说些具体例子吧。比如我扔一个公平的银币,你来猜正反面只能投注某一面,赔率都是1.9,你如何进行投注呢?答案是这个游戏不能玩,假设你投注一百块在正面,那么你有1/2的机会赢90,1/2的机会输100,你的期望值是负的5块钱。谈论凯利判据,首先不能忘记这个大前提,期望值必须是正的。比如我扔一个公平的银币,你来猜正反面只能投注某一面,赔率都是2.1,很明显这个游戏是对你有利的。假设你投注一百块在正面,那么你有1/2的机会赢110,1/2的机会输100,你的期望值是5块钱,也就是统计平均你每次这样投注的获利。那么第一个问题是,假设你有一万块钱,我每天跟你玩一次这个游戏,你将如何进行投注才合理呢?简单的想,一次全压一万块钱期望值最大,但很容易破产。每次压一块钱,你又觉得太稳当了,资本增长的速度太慢。那么中间必然存在着一个最优的投注额,凯利解决的核心问题就在于此。再讲个例子,比如我扔一个公平的骰子,有六面你来猜每次只能投注某一面,赔率都是6.3。假设你投注一百块在点数5,那么你有1/6的机会赢530,5/6的机会输100,你的期望值也是5块钱。对你来说,我扔银币和扔骰子两个游戏一样吗?能用相同的方式投注吗?人工智能会毫不含糊的把所有棋赛分成三类,第一类棋赛相当是赔1.9的银币,告诉你不要去玩。第二类棋赛相当是赔2.1的银币,第三类棋赛相当是赔6.3的骰子。然后再结合你个人的风险偏好,给出具体量化的投注指导。

凯利投注的数学理论比较复杂,有兴趣的读者可以阅读参考文献中Edward Thorp的综述文章,其中对于数学推导和体育博彩的应用都有精彩的论述。一般来说,完全按照凯利投注公式的结果进行投注,是数学上最优的,但同时也非常的激进。当我们建立的模型对一方胜率估计过于乐观时,100%的凯利投注容易导向破产。上图中显示的是1/4凯利投注的数量。基本的思想必须掌握,凯利投注的量是和我们的总资本量成正比的。也就是说,我们赢的时候,总资本量增大,赌注也须相应的增大。输的时候,总资本量减少,赌注也须相应的减少。这个数学投注理论,和急眼了的赌徒心态,恰好是相反的。

四、展望——围棋彩票的制度

未来我国如果跟韩国一样,开展职业围棋的彩票活动,进一步开拓围棋的市场,让围棋活动的推广更加深化,必须有规范化的彩票制度。本文重点谈的赔率问题,目前在世界上有两大制度:

1、彩池比例制。最出名的例子有香港马会。香港马会是个慈善机构,所有马的赔率都是通过计算机自动浮动调整的。用大白话说,押得多的马赔率自动变小,押得少的马赔率自动变大。每场马,香港马会有固定的收益接近18%。不管跑马的结果如何,不管观众的投注如何,马会所得盈利是总投注额的一个固定比例。在此制度下,马会相当于是一个中介机构,玩家只是和其它玩家对赌,看谁的眼光更加准确。

2、固定赔率制。如我国的足球彩票,主要是学习欧洲赔率的玩法,一场球赛的胜平负赔率是固定的,那么每场球赛的结果,和球迷的投注情况都会影响庄家最终的盈利。统计上,多次的平均是盈利抽水率的比例,具体可以参照上一节的分析。


围棋彩票因为是一个新生事物,我个人的建议可以参照香港马会制度,把围棋彩票行业做成慈善机构,用自动浮动的赔率来稳定住盈利,可以最小化风险,并且给玩家提供更好的服务。

参考文献:

本文的参考文献主要分三类。

一、人工智能基础

1.I.H。_Witten,_E。_Frank_and_M。_A。_Hall,DataMining。

2.Andrew NG,Machine LearningLecture Notes。

3.John D。 Kelleher, Fundamentals of Machine Learning forPredictive Data Analytics。

二、预测建模数学

1.Daan van Gemert,Modellingthe Score of PremierLeague Football Matches。

2.Edward Thorp,The Mathematics of Gambling。

3.Rick Durrett, Probability Theory and Examples。

三、凯利原理投注

1.Alistair D。 Fitt,Markowitz portfolio theory for soccer spreadbetting。