好棋网 | 象棋+围棋+国际象棋+棋类导航

 找回密码
 立即注册
搜索
查看: 30512|回复: 0

如何下出一步好棋?

[复制链接]

459

主题

551

帖子

2784

积分

超级版主

Rank: 8Rank: 8

积分
2784
发表于 2016-4-25 12:16:37 | 显示全部楼层 |阅读模式
本帖最后由 好棋网 于 2016-4-25 12:18 编辑


  解决一个问题或许就能解决另一个问题。我们许多人有烦恼,导致这一个问题的原因何在?有人说是没有解决某一个问题,如果解决了某一个令人烦恼的问题,就会没有烦恼,达到无忧无虑的美好境界。事实上如何,还有待观察。但是,我发现,在现实生活中,若能解决一个问题,就有可能解决另一个问题。比如,我们面对“如何把优势棋赢下来”的问题时,就想出了不少“办法”,我经过深入思考之后,发现“如何把优势棋赢下来”的背后存在另一个问题,即解决了这一个问题,就容易解决“如何把优势棋赢下来”的问题了。笔者的思路是,解决了“如何下出一步好棋”这一个问题,那么“如何把优势棋赢下来”的问题相对容易解决了。为何说解决了“如何下出一步好棋”,就能容易解决“如何把优势棋赢下来”的问题呢?从实战中来看,我们许多时候没有把优势棋赢下来,最主要的原因是没有持续地下出好棋,若是能持续地下出好棋,自然可以把优势棋赢下来。
  一、“好棋”的相应性
  关于好棋的判断,在另一文有所论述,本文以最强手或最优着法来判断一手好棋,这个比较实在。笔者认为,超过6层变化的棋,对于普通人来说是有难度的,也是难以判断的,若是允许的情况下,我们能算到6层的变化,选择最优的一步棋,便是好棋。本文就围绕这一步好棋来讲我们的思考与决策。据有关研究认为,象棋大师也只能推理到9层变化,超过9层的变化,象棋大师们的思考也是模糊的,而不是精确的。对于普通的个体来说,若能算到7层就不错了。
当我们面临一个局面时,不管这个局面是什么样的局面,我们都可以为双方寻找最强的一手,这是我们的能力问题,至于博弈双方谁胜谁负不是我们关注的焦点,我们只研究“给定条件下的局面”,并就这一个局面给出:双方下一手的最强手是什么棋。为了解决这一个问题,我们一般需要对局面进行分析,并试演变化,证伪等。
  “好棋”不是指“神之一手”,现在的程序可以通过穷举法搜索很多变化,能列举出20层或更多次的变化,他们会下出普通人无法看到的精妙之着,这对于人来说,是极难做到的事情。“好棋”会删除这一种“神之一手”的条件约束,从现在的角度来看,只要能在9层变化之内的最强着法,就是好棋了。对于普通个体来说,无需拥有大师们的精妙,更不要需要超级电脑的“神之一手”,如果能持续地下出6层变化内的最佳着法,就是好棋了(“深蓝”的设计者许峰雄曾表示,一般的国际象棋手能想到后7步就很不错了)。
  能下出一步好棋,若是能有效复制其思想与方法(程序),就能下出所有的好棋。关键是我们如何复制这一种好棋的构思和运行的模式。
  二、弈棋的基本程序
 (一)形势判断
 1、局面分析;
 2、双方存在的问题或优缺点;
 3、我方的各种策略。
  (二)、着法试演
  1、假定各种变化(所有的变化),这一种思考方法叫穷举法;
2、假定双方“最强的应手”,推理变化;
3、推理至最有利的局面或结束局面为止。
  人类常见的思考是各种着法的推理,这与计算机有不同之处。运用暴力穷举法解决问题的能力,人类是不可能比计算机强大的,特别是完全信息竞争的游戏。
 (三)、搜索着法--算法的升级
 在搜索着法方面,最近企图靠机器战胜人类的人是科学家图灵,图灵预言电器会下象棋,他还写下了程序。人类在电脑出现后,对此进行了深入的研究。在国际象棋方面,人类编写的程序最终战胜了人类顶尖的大师。这说明电脑在着法搜索方面达到了一个较高的层次。
 贪心算法给出的往往是局部的最优着法,而不一定是全局性的最优着法。对于个体来说,若能精通这一种算法也是一种成功了,现实是我们许多人连“局部最优着法”都无法做到。
  Alpha-Beta算法推动了着法搜索的研究。1958 年,位于美国匹兹堡的卡耐基梅隆大学的三位科学家(Newell, Shaw Simon)的重要发现使得这一问题有了重大突破。他们发现:在搜索中,可以“砍掉”搜索树中的大部分分支而不影响最终的分析结果。他们称之为: alpha-beta算法。有一点非常重要值得指出:这个算法是由纯数学理论得来的,没有附加任何的国际象棋知识。alpha-beta算法的工作原理:假设计算机计算完第一个变着后,正要开始计算第二个变着,如果这一步棋的计算结果数值低于第一着棋,那么计算机可以立即停止继续向下计算。我们没有必要知道到底第二着棋的分值比第一着棋低多少。程序会很自然地选择第一步棋的方案。
现在算法有了突破性发展。AlphaGo在算法方面引入了多种算法,比如蒙特卡洛树搜索法,神经网络算法等,在20163月战胜了人类代表李世石。AlphaGo高效融入多种算法之后,取得最终的胜利,这也是算法的胜利。 
未来,人类在算法方面还会进步,这是一种必然趋势。
 (四)、证伪着法
 证伪是需要成本的,比如时间成本。弈棋时,就某一个着法进行证伪,我们需要反复求证某些着法的不可行性,若是无法证明其不可行性,则该着法是可行的。就着法试演变化的过程,进行证伪,即寻找出原来推理的漏洞,若无漏洞,便是好棋,若有漏洞,但不是好棋。这一种思想来自科学哲学家卡尔·波普,在弈棋方面得到了爱尔兰科学家米歇尔·考利的试验证明。2004年,爱尔兰科学家米歇尔·考利所做的一项试验表明,国际象棋大师们算棋时的思考方式与众不同,他们更倾向于用“证伪”的方法来检验自己准备走的下一步棋,即为这个棋步设想最糟糕的局面,而不是设想有利情况。提出一个设想,想种种办法来证明它是错的,如果办不到,就暂时接受这个设想,这种检验方法称为“证伪”。此概念由科学哲学家卡尔·波普提出,现已被公认为科学研究的基本特征。但认知科学显示,人们一般很难用“证伪”的方式来思考,包括许多科学家。
  电脑在证伪方面则简单得多,他们不会消耗过多的精力去证伪所有的着法,只要一个着法的效能(或者说价值)低于第一种变化(或某一种特定的着法),就直接删除,而不是深入研究。电脑程序在搜索完一种变化之后,还会搜索下一种变化,若是时间允许,他会搜索完他认为的所有可能的着法,若无“证伪条款”(条件),电脑搜索最优着法要花很久的时间,因为每一个着法的背后会有许多种可能性变化,只要加入了“证伪条款”,电脑可以直接跳过去(有一些变化明显是不好的),这样可以节约时间。在电脑看来,即便是可行的棋,只有最优着法才是最好的棋。
 (五)、如何判断一个局面下最优着法
  最优选择(系列最优着法的统称)的结果肯定是较好的,当我们搜索出了若干变化之后,如何判断一个局面下最优着法,是一个非常重要的问题。一般来说,我们在可行的变化中,会选择最强应手。决策选择是一件很难的事情,关键问题是我们无法确定每一种变化,或者说每一着最有利的变化值。现实对弈中,我们多数弈棋者是根据经验来判断的,即主观判断,故我们的选择存在“侥幸”的成分,我们没有根据客观的数据选择最强手(我们很难做到这一点,故,做不到)。
搜索系统(任何棋类),若没有搜索到结束的局面(若能搜索到结束的局面,就容易判断价值的大小。)我们面临搜索比较深的局面和搜索比较浅的局面,在给定的条件下,直接评估特定局面下的不同走法的“好坏”。现在有相关的理论研究(象棋或围棋等理论),我们应用过去的理论来作判断,存在主观因素的影响,而不能作出客观的判断。对于一个局面,如果能知道这个局面下最好的走法(或者几个走法),我们对弈时就直接选择这个走法,将会得到较好的结果(当然,必输的棋局,最后也会输掉。)。
  我们人类选手,只可能根据自己的经验(或理论)给出相对“好”或者“坏”的判断,只有AI搜索引擎等工具给出绝对的“好”的判断。在这一点上,存在较大的研究空间。人类如借助AI的形势判断方法,可以提升对棋局的“客观”判断能力。
  (六)、训练“正确的思考”
  一般来说,一个人能下出一步好棋,就具有持续下出好棋的能力。人们在训练“下出一步好棋”的能力方向,提出了残棋研究的方法,这是一个有益的探索,我们可以从许多弈棋高手的言行看出,做死活题(残棋研究)是提升棋力的有效方法。棋手多进行这样的训练,对提升棋力是有好处的。做死活题训练,可以把上述5点落实到“实战”中,且是有效检验思考是否正确的方式。
  (七)、复制“有效的计算模式”
  复制“有效的计算模式”是取得成绩的重要思想,这一种思想过去是有效的,这样做可以减少无谓的探索,提升着法的品质。
电脑可以复制高效的计算模式,而个体却无法稳定做到这一点,在实战中,有一些人能下出一盘精彩的好棋(无懈可击),却无法长期下出这一种好棋,说明人脑在复制计算模式时存在差异性,比如状态,情绪等影响。
  复盘往往是检测现有计算与原有计算之间误差的一种途径,我们可以通过复盘来检测自己的正误,不断提升自己复制“有效的计算模式”的有效性。
  三、人生棋局的“好棋”
  我们普通个体很难下出最妙的“神之一手”,我们只要能在相应的范围内选择了最佳的手段,实现了特定的目标。
  1、根据经验或规则作决策
  下出人生棋局的好棋是有难度的。这里给出几个指标来判断人生棋局的好棋,一是回报性,每一步棋都有其相应的回报,若在可预期的范围内无回报的棋,便不是好棋;二是低风险性,可选项是无懈可击的,即便遭遇不利的市场外的变化,仍然不会受到较大的损失,现在有些人的决策是只看机会和回报,没有看到风险,这种思维方式在市场好时,容易赚大钱,市场不好时,容易全军覆没,这样的思维和行为方式肯定是不行的;三是可证伪性,每一个决策是经过证伪的,而不是想当然如何,尽量减少情绪(或主观因素)对决策的影响。
  人生棋局的每一步棋都需要经过反复衡量,若不能同时满足三个条件,往往不是最佳的选择。若是同时符合这三个条件,也要比较,选择最优着法(选项)。
  2、借助AI工具的优越性能作选择
  关于人生棋局中的好棋,随着科技的发展,人们对“好棋”的选择会因人而异。未来的暴利的机会逐步下降,这是AI发展的必然趋势,也是人类完全竞争导致的必然趋势。人们在未来的竞争中,需要借助“优势的行业AI工具”为自己的决策提供帮助。仅靠自己个体的计算,我们的决策很有可能陷入困境。预期未来的人生决策,只要输入若干条件,AI就可以为人提供相应的决策。比如我们给“人生好棋”三个条件(正回报,无懈可击,可证伪),AI会不断地给我们“最优方案”,这或许是我们理想的“好棋”,若想拥有“神之一手”般的好棋,则需要超级AI的帮助了(我们需要支付的成本会更大一些)。
  3、心态上要端正
  我们无法持续下出最强手。若是我们可以持续地下出最强手,我们就可能成为一个行业顶尖的人物,或全球顶尖的人物了,从现实现象可以看出,我们不可能或很难持续地下出“好棋”。所以,我们对待“好棋”这个目标的追求,应该是全力以赴,而不需要去为结果而高兴或痛苦。只要我们努力了,我们的人生棋局就是无悔的,而是值得铭记的。
我们个体无法下出“神之一手”的妙招。在2016年,阿法狗Alfago能走出令职业棋手们意想不到的妙招,战胜了韩国顶尖围棋高手李世石。正如武侠小说里描述的那一样:“从对手决计料想不到的部位刺进来",事后中国围棋顶尖围棋高手柯洁说他预料到了Alfago的那一潜在手段。顶尖的职业高手有可能会下出“神之一手”。像这一种无法复制的妙手,普通人不要企图靠这一种难以把握的东西实现人生棋局的逆转或成功。在人生棋局的经营中,我们最需要的是无懈可击的正招。
  4、局部的最优选择
  全局性的好棋,往往是局部系列的最优选择(最优着法),当然是好,但对于个体来说,或较难把握,或是看不到。我现在更倾向于局部的最优选择,对于1个月内的目标更有感觉一些,对于1年以上的目标,暂时没有特别大的兴趣。经历过很多事情之后,学会了现实,不再好高骛远,在作决策时,更在乎可预期的回报,而不是长远的幻想的回报。超过一定限度之后,个体是很难控制的区域,把握的机会也是很难的。
只要锁定可期的利益,才能积小胜为大胜。韩国李昌镐就是靠此策略获得持续成功的。
  5、完美无瑕是很难的标准
  我们可以要求自己做到极致,做到完美无瑕,在现实生活中,真正做到这一点,又是非常难的事情。比如本文的写作就是一个难度极高的事情,花了数天的构思,也没有给出完美的答案。为什么会出现这种现象?有两个原因,一是笔者能力有限,二是本文标题提出的问题比较大。我们可以从全文来看,本文不是完美无瑕的,我们可以挑出不少问题。我想,如果换一个作者来写作此文,或许不一定能有更好的表现。挑问题比较容易,做到完美无瑕往往是非常难的事情。
  若是每一步棋都是完美无瑕,无懈可击,那自然是最好的棋了。在实战中,还没有人可以下出这样的像神一样的着法,即便是现在的顶尖AI,也有可能存在这样或那样的问题,何况普通的个体。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

GMT+8, 2019-8-19 22:06 , Processed in 0.054422 second(s), 22 queries .

© 2010-2020 好棋网

快速回复 返回顶部 返回列表