人机大战：机器会走棋，人类干什么？ │夏雨│东洋镜

首页 >> 论坛 >> 转贴

	字体∶大中小
人机大战：机器会走棋，人类干什么？
夏雨 (发表日期:2016-03-09 20:00:33 阅读人次:5909 回复数:22)
先上跟贴：　　旁观者昏我觉得这篇文章所说的观点不够有说服力。 [ 　　越南人 “没想到这一天来的如此之快,李世石输给AlphaGo” 第一盘是最难的，也许是电脑最有机会的一盘。之后李世石还是会有机会的。金成龙应韩国媒体要求再次扶额长叹，现场长枪短炮闪光灯声如同暴雨　　凯源人输了。　　旁观者昏 “是啊，那家伙根本就不犯错误。” 这就是美国引领技术的实力。这一步意义深远。　　越南人 “电脑通常是越下越厉害。” 　　旁观者昏 “自由的环境产生创造力，又一个证明，虽说多一个不多。” 从头看到完。水波不兴地就把小李给干掉了。聂卫平这种家伙还说机器永远下不过人类呢。这就是文革时代的人认识上的局限，多懂围棋也没有用。俺至少认识到迟早人类要输，哪有永远那么远，即便这次赢不了。　　旁观者昏 “中共，普金们永远也认识不到这件事情深层的意义。” 　　这东西比原子弹厉害，READ MY LIPS，尽管美国的原子弹已经最厉害了。人类应该为自由自豪！　　　正文　　　机器会走棋，人类干什么？” 2016-03-08 　　　　作者：醒客　　机器人是终结者，所有能够制定规则的比赛，人都可能无法再赢了。　　【了无生趣的游戏】　　2015年10月，谷歌旗下公司开发的AlphaGo围棋软件，以5:0的成绩打败欧洲围棋冠军樊麾，人工智能再下一城，前一个标志性事件是1997年IBM电脑软件深蓝战胜国际象棋冠军卡斯帕罗夫，当年是国际象棋，现在是围棋，从电脑计算的角度看，围棋要比国际象棋复杂得多，时隔18年，AlphaGo与深蓝的进步在于，深蓝只是知识的储存者，AlphaGo则具有了学习能力。　　一万年前，森林里茹毛饮血的人类祖先与猴子过着类似的生活，今天，人类成为了生灵的主宰，人造航天器已经飞出太阳系，而猴子的生活方式却几乎没变。猴子与人相比的区别，一代代人的知识能够通过学习来累积，而一只猴子死后，所有的经验也将随之而去。　　或许，学习能力而不是知识才是人与其他动物的根本区别，机器具有持续的学习能力是人工智能界的重要事件，2016年3月AlphaGo对阵世界围棋冠军李世石的比赛结果已经不那么让人期待了，因为，拥有了学习能力的AlphaGo战胜人类即便不在3月，也不会太久。一个时代已经开启：过去，机械的发明，机器代替了人的体力；现在，电脑的发明，机器正在代替人的智力。　　各种棋类运动，尤其是围棋、象棋这种具有历史渊源的古老游戏，虽然规则简单，但棋局却非常丰富，结果也常会出人意料之外，人们喜欢围棋、象棋，就是喜欢简单规则之下智力博弈的不确定性，走棋非常锻炼人的思考能力。AlphaGo作为一项高技术发明，将打碎游戏爱好者们的玻璃心，在人工智能的控制之下，围棋很快就会被“打通关”，博弈结果将是确定的:谁先走谁赢或者谁后走谁赢，弈棋将毫无悬念可言。　　人类的价值在于探索未知，摆脱宿命奔向自由，我们可以随意想象，让那些最天马行空的想法都变成现实，而现在，在既定规则的游戏中，深度学习机器人能够计算出各种可能的结果，就像一场充满悬念的足球赛来了一位先知，提前说出了所有进球的结果，已然了无生趣。　　【机器人，终结者】　　机器人是终结者，所有能够制定规则的比赛，人都可能无法再赢了。　　机器能够帮助人解决任何事情，包含体力的、智力的，即便有些领域智能机器还未来得及进入，也不过只是需要一点不多的时间而已，人与机器所有关于执行力的比较都是没有必要的，都可以提前宣布结果，就像人不需要与汽车比跑步、与吊车比举重一样，人也不需要跟机器比计算能力，无论是简单的加减乘除，还是出差、旅行等各类复杂的事务处理。　　当然，需要补充说明的是，目前机器人成绩还仅限制在人们制定了规则的范围，象棋与围棋是典型的制定了规则的游戏，实际中，规则问题是对现实问题的重大简化，如果把现实问题比喻成实数，那么制定了规则的问题顶多算是整数，也就是说，即便3月份AlphaGo以5:0战胜了李世石，丝毫不能说明人工智能与人的智力有什么可比性。鉴于人工智能还处在萌芽的初期，所有人工智能挑战人的试验几乎都是“命题”比赛。　　机器是复杂的工具，自从工具发明以来，工具的作用就是替代人的部分能力：树枝替代手指、锤子替代拳头。随着工具的进展，人与工具的边界也在不断变化：杠杆等只能改变力量的使用，人与工具的边界是能量；蒸汽机、汽油机增加了人的能量，人与工具的边界是智力与体力；电脑能够计算和处理事务，智力的边界被打破。　　具有学习能力的机器正在驱逐人类，不仅仅生产线上重复体力工作的工人，那些看上去需要文化实际只是重复脑力工作的白领，比如记者、统计员甚至分析师，人将被迫从各种重复性工作中彻底退出。　　【创意的时代】　　工业时代，经验是人最重要的工作能力，信息时代，智能机器人的知识库和深度学习让专家们津津乐道的资深工作经历黯然失色。创意而不是重复性的生产才是未来重要的工作。　　对于理工类同学，坏消息正在来临，那些只是寻求答案的工作，无论多复杂都将是机器人的天下，而那些从事艺术的同学则要幸运的多，哪怕简单的创意也能体现工作能力。未来，一件事务可以区分成两个部分：设定目标、执行目标。人做设定目标的工作，执行目标则交给有学习能力的机器。　　传统的工作以生产出来的产品作为评价标准，工作投入的时间量与产品的数量息息相关，工作投入的时间越多，产品的生产量也会越多。创意工作无法设定目标，结果也不可预知，创意的重点不再是提高生产效率而是如何减少试错。　　不仅人工智能不能替代人类，人类的一个个体也都无法替代另一个个体，我们可以为别人做很多事情，向父母尽孝、抚养子女，但无法替代他们，成为他父母的孩子、孩子的父母，也替代不了他爱人的陪伴。　　人类在嗜血的丛林胜出，成为生命的领导者，一直都面临着各种威胁，但能够击败人类的只有人类自己。

回复[1]: 夏雨 (2016-03-10 15:41:10)

　　李世石输了人类还有谁？中国天才：我！！！(

　　环球时报综合报道】此次比赛采用中国围棋规则。每位棋手各有两个小时布局时间，1分钟读秒3次，每场比赛预计要4至5小时。

　　当地时间9日下午1时，人机对攻正式开始。一开局就显得惊心动魄，李世石执黑先行，第一手棋下在右上角小目，显得不同寻常，而“阿尔法围棋”一改人工智能高速决策的作风，足足“思考”了1分半才在左上角三三落子。一度“阿法狗”处于领先位置，2小时后，李世石优势逐渐开始明显。进行到第3个小时，“阿法狗”后发制人，与李世石形成僵持局面，现场气氛一度十分凝重。之后李世石出现明显失误。在对弈进行到3个半小时后，李世石遗憾地摇摇头，以执黑186手负于“阿法狗”。

　　所谓“人机大战”，其实见人不见“机”。对局中，一名业余围棋六段棋手扮演“阿法狗”的“眼”和“手”，边看显示屏边替“阿法狗”下棋。“阿法狗”智能程序于2010年诞生于英国，由哈萨比斯等人在英国伦敦创建的人工智能公司“深度思维”(DeepMind)开发。2014年，美国谷歌公司收购了“深度思维”。2015年10月，“阿法狗”曾以5比0战胜欧洲围棋冠军、前中国职业棋手樊麾二段。《印度时报》称，樊麾只是全球第633号选手，与李世石不可相比。谷歌“深度思维”CEO哈萨比斯在赛前曾介绍说，在与樊麾对局后他们又对“阿法狗”进行了改进，此次他们选择长期稳居世界围棋冠军地位的李世石，就是为了进行一次“历史性对决”。

　　比赛前一天的记者会上，李世石曾表示，对这次对弈有自信，“但以5比0全胜并不容易”。在首盘告负后，李世石在记者会上表示，对于“阿法狗”有两点让他感到震惊。一是其初期布局能力令人惊讶，二是 “阿法狗”往往在他感觉双方都很难下的地方干脆出手。

　　剩下的四盘对局将分别于3月10日、12日、13日和15日举行。胜者将夺得100万美元的奖金。李世石说，虽然首盘有些令人震惊，“但是棋下得非常愉快”，他表示现在的胜率是“50%对50%”，对接下来的对局“充满期待”。

　　刚在“农心杯”再次战胜李世石的中国年轻职业棋手柯洁当天通过微博放话说，“就算阿法狗战胜了李世石，但它赢不了我”。

　　柯洁9日接受《环球时报》记者采访时说，机器已经战胜人类了。未来几天的战局胜负难料，出于人类心态上的原因，计算机的胜算可能会更大，“但围棋的精髓和文化的内涵还需要人类的传承”。

　　柯洁微博自我介绍原文:

　　看来围棋盲还是不少啊，在这里我简单介绍一下自己：我叫做柯洁，97年出生。现在暂时是世界围棋第一人（特地用了暂时，谦虚是美德）正式比赛我是单盘8:2碾压李世石（他赢得这两盘没有任何作用）世界冠军获得过三次（此年龄如此成绩前无古人）大小国内赛事冠军数次我本来真不想提这些得因为我是一个低调的人，是你们逼我的。。哈萨比斯此前曾表示，他也期待“阿尔法围棋”能与中国高水平棋手对弈，“比如柯洁”。

　　柯洁发表这番言论是有底气的，他在2015年世界大赛豪取三冠，与李世石的交往战绩是8胜2负。不久前刚结束的农心杯三国擂台赛上，柯洁作为主将力克李世石助中国队捧杯，论现在的实力和状态，柯洁有资格以世界第一人的身份作为人类代表。<br/><br/>如果李世石与谷歌AlphaGo的五番棋大战最终落败，柯洁会是人类的最后一道防线吗？

　　

　　砂锅2 发表评论于 2016-03-09 22:22:04

　　google真得牛逼

　　================

　　跟股沟有什么关系？不就是出钱买了个英国公司吗？

　　andromedaM31 发表评论于 2016-03-09 21:49:48

　　是简单错误，alphago没看到征子

　　音爆发表评论于 2016-03-09 21:39:31

　　第二局：刚才几乎所有高手都认为阿尔法Go 走了一手臭棋，柯洁说如果让他接着下，肯定赢狗。

　　最爱卤煮发表评论于 2016-03-09 21:22:24

　　rogger112555 发表评论于 2016-03-09 19:22:28

　　小儿轻狂，下知天高地厚！

　　————————————————————————

　　自古英雄出少年！你也不要太迂腐嘛。

　　andromedaM31 发表评论于 2016-03-09 21:14:47

　　同时看5个直播，这个alphago 决不是简单查询数据库那么泛泛，有自己深刻的盘面理解，比如刚才这个5路尖冲对手四路高拆二，现在已经动出左边那两个残子了，非常厉害，google真得牛逼

　　lzh0007 发表评论于 2016-03-09 20:56:25

　　天才

　　大炮一响发表评论于 2016-03-09 20:48:11

　　克杰是继承了中国的美德，吹牛不上税！

　　PFWL 发表评论于 2016-03-09 20:40:48

　　布局定式等阿尔法围棋调用数据库即可,不会比人差。官子阿尔法围棋则是无懈可击。人要赢, 非靠中盘厮杀不可。

　　Chinucks 发表评论于 2016-03-09 20:24:13

　　武宫正树早就过气了，多年无缘日本主要头衔决赛。现在日本最强是井山裕太，年轻，和柯洁差不多年纪。

　　柯洁和李世石是目前世界围棋二强，棋艺比其他人明显高出一截。

　　hunwei 发表评论于 2016-03-09 20:15:35

　　8：2

　　比8：0 差

　　国人甲发表评论于 2016-03-09 19:43:33

　　rogger112555 发表评论于 2016-03-09 19:22:28

　　小儿轻狂，下知天高地厚！

　　-------------------

　　恐怕是你不知道天高地厚吧！

　　何洁8：2 李世石

　　低智商猪头发表评论于 2016-03-09 19:43:03

　　韩国棋手讲究力量，精于计算厮杀，对阵计算机没有优势。应该请日本棋手，讲究棋道，吴清源老先生已经过世。武宫正树可以试试，第一手天元，前五手就绞杀，再弃子，制造混乱，极大加大计算量。只有意识流才能破人工智能。

　　wangtora 发表评论于 2016-03-09 19:32:28

　　年轻，失误少，可战。但是最终还是人肉挡坦克。奥巴马上台时送习主席围棋盘棋子的意义，已经从认可G2，变味到科技实力碾压的意思了。

　　iBear 发表评论于 2016-03-09 19:27:10

　　炒作自己吧？先自吹，以后赢不赢再说

　　rogger112555 发表评论于 2016-03-09 19:22:28

　　小儿轻狂，下知天高地厚！

　　

　　

　　

　　

　　

　　

回复[2]: 夏雨 (2016-03-10 16:31:36)

　　从人机大战的一个细节来推想

　　2016-03-09 08:07:33

　　再看新浪转播中间时，有一个细节让我惊讶不已，解说的小编在旁边注解说：爱尔法狗的工程师私下认为李世石的取胜几率只有0，我反复的看了几遍，确认没有理解错误。

　　

　　我没有明白这个几率是指五番棋的胜负几率，还是一局棋的胜负几率，我倾向是认为李世石没有机会赢得一局。可以看出爱尔法狗实际上是信心满满的，某种程度上还有许多实力被保留着。

　　

　　论坛中有几位说的很好，人类所认为的漏招，也许是爱尔法狗早就将后面的变化计算清楚了。

　　

　　就比方人类在黑暗中只能凭感觉摸索着向前，电脑有夜视，能够一眼看到很远，所以该跑就跑该跳就跳。在人类觉得危险直接，没有余味，没有保留。而实际上是通向胜利的捷径。

　　

　　人类许多保留余味，恰恰是因为对后面的计算不清楚，所以给自己留有余地。大家都显得高明。电脑在一个局部早就看透了，简单明了的一刀见血。开局的右上方第一场接触战，就马上让小李见识了厉害。小李比樊麾的高明在于，没有让局面马上崩溃，而是巧妙地稳住将战线拉长。

　　

　　相反在中腹很空虚的地方，爱尔法狗的弱点所在，小李也是凭借中腹围住，将局面拉平的。

　　

　　盘面越空虚，人类的感觉才能站得上风，到了后半盘官子阶段，或者局部的死活对杀，人类基本上没戏。那是电脑的天下。局面越到后面，计算量越少，电脑算的透彻清晰。而人脑则会出现大量的半目一目的失误。

　　

　　我认为人类要赢在布局、序盘的感觉上，要运用弃子、打劫、转换之类的高级战术。

　　

　　但是不管怎样，电脑的进步是人脑无法比拟的。

　　

　　现在看看老聂之类的中国棋手是多麽的坐井观天，

　　

　　没有找柯杰去挑战阿尔法狗，是柯杰的运气。

　　

　　

　　

　　

　　wangtora 发表评论于 2016-03-09 15:53:29

　　电脑并未算清所有变化，比如右下官子落后手。但是电脑赢在了人类不能算作失误，但是不完美的地方。等iPad版出来，将是围棋运动的结束。

　　武胜发表评论于 2016-03-09 12:40:38

　　这是说的大话，自我鼓劲。李是后半盘失误痛失好局，中盘优势时大意了，右面没下好。

　　人与电脑对弈承受的心理压力是不对称的。尽量减少负面的心理波动，后面几盘李应该可以占上风。至于中国棋手，一定会有机会的。

回复[3]: 赢了组长 (2016-03-10 17:45:29)

　　要是下到底，大概能差十几目。

　　真要进入可怕的时代，没准儿。

回复[4]: 这傻屄！ 老唤 (2016-03-10 22:36:09)

　　喝了酒再上网，肯定骂街！所以我尽可能不上网。

　　如果【环球】真有上面的那篇文章（懒得查了），其作者不折不扣是个正宗傻屄！

　　我说过：傻屄的特征之一就是不懂装懂，比如陈永贵，挺好的一个农民，结果当了副总理，不是傻屄是什么？还有成龙呀，那个女乒冠军啦（叫什么来着？），什么的。。。

　　我虽然喝了酒，但是逻辑思维没问题。比如：

　　1，那傻屄说：【每位棋手各有两个小时布局时间】。妈了屄的懂不懂什么叫【布局】！省略解说。。。

　　2，【一开局就显得惊心动魄，李世石执黑先行，第一手棋下在右上角小目，显得不同寻常，】走小目最他妈多见，这孙子学过围棋吗？

　　3，【足足“思考”了1分半才在左上角三三落子。】哪儿他妈有三三？这傻屄不但不会下棋，连他妈了屄的数都不识！

　　4，接下来，算了，越说越他妈不像人话！这傻屄还不如陈永贵呢！

　　不过，话说回来，这一天来得如此之快，还是令人惊讶！划时代！由此我更加敬佩google，不管是英国还是美国。

　　不管结果几比几，李世石的下坡路是走定了，他的神话就此终止：他让人们看到了他计算上的失误。即使赢了这100万美元也还是亏。

　　柯洁是人脑的天才，也许和今天的alphago能有一搏，但是你一旦教会了它，它立刻就成了你的克星。

　　何曾几时，记得十几年前在NHK围棋节目听日本棋手（武宫？）说，围棋博大精深，非成年人不能取其精华，而电脑在这个领域里是永远不可能战胜人类的！而现在，这两个信念都被打破了。

　　

　　

　　

回复[5]: 采夫 (2016-03-11 00:19:17)

　　阿拉都被这些大师忽悠啦。

　　以为祖宗整出来的这个玩法是神的游戏。

　　

　　计算机在国际象棋上早就压制人类了。

　　其实围棋也是逻辑、判断这些个事项麽。

　　可能是前久沟谷的智能汽车闯了祸，整出这么个公关项目来。

回复[6]: 你说未来刺激不刺激? 夏雨 (2016-03-11 14:06:43)

　　越南人 “从机辅助人到人辅助机,你说未来刺激不刺激?” 2016-03-10 16:55:02

　　

　　大数据的时代，

　　由于人的记忆力和运算力远小于计算机，

　　于是出现人理解不了计算机决策的现象。

　　在美国的一些城市，

　　导入了计算机犯罪预测系统，

　　结果出现了人根本不知道：

　　计算机为什么会指出某些看似没问题的地区会出现犯罪。

　　但事实是计算机预测的比人准多了，

　　结果是：别问为什么，计算机那么说了，

　　赶快多派警力到那里----成了地道的计算机指挥人。

　　AlphaGo赢了李世石问题还不大，

　　问题大的是所有观战的职业棋手，

　　都对AlphaGo的许多创造性的招数看不出其用意何在?

　　古力九段感叹：值得偷师学几招；

　　职业棋手李哲说道：对职业棋手的我来说，比看到外星人还震撼；

　　AlphaGo怪异棋招震惊柯洁：

　　柯洁大呼“一辈子都没有见过这样的棋”，直言“很奇怪”，

　　“谷歌AlphaGo不存在背错定式，它竟然不按照定式，

　　已经有了自己奇特的思路。完全不懂它为什么这么下。”

　　人有左右脑，

　　AlphaGo也有。

　　它应该是用神经元电路的右脑高速地判断大势；

　　再对右脑得到的比较好的一群解，使用左脑的超强计算功能逐个精密分析。

　　右脑记忆历代高手棋谱，举一反三；

　　左脑对举一反三的结果再三比较，以求无错。

　　还有机器学习九段的下棋手法，再通过自我演练

　　就相当两个九段每天训练成千上万次，

　　会产生许多只有机器才知道的“九段水平”的新棋谱。

　　我前几天就说了这种观点，

　　当时柯洁还以为自己能战胜AlphaGo呢.

　　由于自我演练也每局都基本上有输赢，

　　所以每下一局右脑就会有提高。

　　还有现在发展中的量子计算机(相当右脑功能)，

　　比现在的计算机快得更出奇，

　　一千万年的计算量，弹指一瞬间就可完成。

　　你说未来刺激不刺激?

　　

　　

　　越南人 “刚看到一点专家说法，跟我上文分析几乎完全一致” 2016-03-10 19:28:28

　　面对复杂局面，Alpha-Go不是作穷举计算，两个深度学习算法极大地减少了计算量。“策略网络”算法负责下一步的落子选择，从理论上存在的平均200种可能选择，缩小到三四种得分最高的选择；“价值网络”算法负责评估落子后的局面与最终胜负的概率关系，就是判断局面是否处于优势，优势多大。前者减少计算的宽度——不用去计算所有落子的可能；后者减少计算的深度，不用徒劳地去尝试算到底。谷歌研究者们用许多专业棋局训练AI，这种方法称为监督学习（supervised learning），然后让AI和自己对弈，这种方法称为强化学习（reinforcement learning），每次对弈都能让AI棋力精进。

回复[7]: AlphaGo:自学成才 夏雨 (2016-03-11 13:59:04)

　　“(ZT)揭秘AlphaGo:自学成才一个会推理的大脑” 2016-03-10 06:23:08 [点击:121]

　　

　　5个月前，战胜欧洲顶级棋手的AlphaGo，那时候的水平被中国棋院评价为，强业5水平，即职业的初级入门层次。到如今战胜李世石的一流九段水平。150天时间，AlphaGo进步可谓光速。虽然有不少观战棋手为人类顶级选手的落败找到了诸多理由，譬如没有发挥出实力、第一盘他更多的是在测试对手功力、第二局的争夺当会更加激烈刺激等云云。但正如负责解说的陈盈初段则反问道：焉知今天不是AlphaGo在测试小李？

　　用另一个评判标准Elo（围棋等级分）来看，可以算出去年年底AlphaGo的棋力是3168，而同期李世石的Elo大约是3532，目前排名第一的是中国棋手柯洁，李世石排在第4位。从这一数据指标来看，AlphaGo这几个月的成长确实非常惊人。舆论猜测：Deepmid应该改进了AlphaGo的神经网络。对樊麾的比赛中，他们使用了3000万个位置作为原始数据，来训练AlphaGo的价值网络；在对李世石的位置中，他们可以使用1亿个位置训练；另外，也投入了更大的运算量。

　　有关AlphaGo在这几个月的“进化程度”，谷歌官方并没有给出任何确切的介绍。但是有位名叫安德斯-可鲁夫的围棋游戏设计师给出了这样的猜测：深度学习。即机器通过深度神经网络，模拟人脑的机制来判断、学习、决策。AlphaGo首先习得了人类围棋大师3000万步的走法，之后自我博弈3000万局积累胜负经验，从而构成策略网络，给出落子选择；同时，在自我博弈的训练中形成全局观，构成评价网络，给出修正落子选择。如此循环往复的学习进阶，让AlphaGo可以与李世石分庭抗礼。

　　

　　和1997年美国IBM公司的“深蓝”超级计算机不同，阿尔法狗并不是列举穷尽所有的可能，而是通过“经验”推理出最优解。

　　换言之，李世石昨天面对的不是叫做AlphaGo的计算机，也不是被网友调侃的一条狗，而是一个类人，它有着和人类一样的学习能力，而且学习效率更高、提升的速度远远快过人类。所以，它仅仅用了不到半年时间，就从勉强的职业入门水准飙升至职业最高水准。再给它几个月时间，AlphaGo岂不是要上天吗？

　　AlphaGo的学习能力有没有上限呢？显然这个问题，已经超过了人类的智力上限。英国曼彻斯特大学计算机科学教授凯文-柯伦认为，人类没有理由相信技术会有极限，特别是在AlphaGo这样的特定领域。而来自南京大学计算机系的周志华则认为，上限是客观存在的。周志华表示，“强化学习”奏效的关键，是两个模型都不错，而且有足够大的“差异”。当模型性能提升以后，其差异会显著下降，到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本的数量。

　　虽然人工智能的智力水平的顶峰高度依然存疑，但在情绪因素导致的失误方面，人工智能显然是无瑕疵的。AlphaGo的手下败将樊麾在复盘去年十月的那场人机大战时就表示，最大的问题在于人都会犯错，而机器犯错几率比人少得多。这样的现实，随着比赛的推进、时间的推移，人类选手会因为体力的消耗而更增添精神层面的负担。对人类选手来说，他们的形势不管好还是不好，都担心自己犯错，而根据“房间里的大象”原理，你心里想什么或者担心什么，现实世界就越会发生什么。

　　但如AlphaGo这样人工智能则完全没有这类概念。这就导致了人类选手的尴尬处境：在优势时，不认为自己能把握住优势；在劣势时，又认为自己一定会输。当年击败众多高手的李昌镐，被称为“石佛”，就是因为他心态好，比赛全过程面无表情，让对手感觉不到他的任何波动。但如今，谁能比AlphaGo更“石佛”呢？即使让人类“石佛”李昌镐对上机器“石佛”AlphaGo，一个是面无表情，另一个是连面都见不到，这样的对决，在心理因素层面，就是不对等的。而这样的不对等，又会诱发人类选手使出小聪明，试图戏耍机器，最终结果却是搬起石头砸自己的脚。

　　国际象棋一代棋王卡斯帕罗夫对此深有体会。他表示，早期的国际象棋程序有盲点以及一些可以利用的弱点，不禁使人想要去利用，而不是去下堂堂正正的棋。自己当年跟深蓝下的时候就忍不住这样做了。国际象棋和围棋，需要强大的专注力。可是如果老想着去骗电脑，自己的专注力就被破坏了，最后反而会骗了自己，下出疑问手。电脑越强大，这些疑问手就越会被惩罚。

　　面对一个既拥有超强学习能力和无敌定力的机器，似乎不用多久，十个李世石都无法战胜之。

　　

回复[8]: 为什么AlphaGo会遇强则强 夏雨 (2016-03-11 14:01:58)

　　

　　知乎：为什么AlphaGo会遇强则强

　　某些人猜测AlphaGo会遇强则强，认为AlphaGo会模仿对手的棋风下棋，如果遇到樊麾二段，就会下出樊那样的水平较低的棋，而如果遇到好战的李世乭九段，则会变成一头嗜血的怪兽。

　　事实上，AlphaGo的确会遇强则强，遇到李世乭可能赢二目半，遇到业余6段可能也就赢二目半。但这并非是因其会模仿对手的棋风。因为AlphaGo是通过海量人类对局数据库来训练对棋型的感觉，再从模仿人类选点中筛选胜率最高的一招棋的，因此它不会去专门去模仿特定对手的所谓棋风。但由于AlphaGo筛选选点的唯一考虑因素是胜率最大，而非最凶狠走法和局部最佳应手，也就是能赢就行，不求大胜，比如说选点A有99%的概率赢半目，选点B有98%的概率赢20目半，那AlphaGo就会选择A，而淘汰B，而且为计算获胜概率，它要假定你是最强对手，假定你会算到它能算到的各种变化，所以面对弱手，AlphaGo也会淘汰掉会因强手才能下出的强烈反击从而招致自己胜率下降的棋。这导致AlphaGo遇到弱敌也会走出看似很缓的棋，似乎它遇弱则弱。

　　在与樊麾的第2局棋中，执黑的AlphaGo第135手没有选择扳杀白右上角的走法，而是选择跳，放活白角，这一手被中国职业棋手广为诟病，认为AlphaGo计算力太差，连这么简单的死活都没算出来，其实这是没有理解AlphaGo的选点标准，它肯定是算出杀棋的胜率不如放活的胜率高，所以选择了稳赢的放活。

　　因此，在局面领先的情况下，AlphaGo常会走出人类棋手所认为的缓手，从而缩小了领先优势，其实这正是AlphaGo的强大之处，它通过选择胜率更高的退让走法，虽然损目但提高了胜率，从而将其优势转化为不可动摇的胜势。而很多人类棋手反而会在优势局面下贪吃争胜，从而走出过分的招法导致逆转。

　　必须指出的是，AlphaGo并非一味退让，只有当损目的走法胜率更高时它才会选择退让，否则它永远会走在最大的地方。3月9日对李世乭九段完胜的第一局，就非常完美地体现出了AlphaGo的这个特点。

　　AlphaGo的棋让人想起了李昌镐九段全盛时期的招法，经常走一些看似缓手的自补，其实这正是李昌镐和AlphaGo的英雄所见略同啊，已走下神坛的李昌镐，看到AlphaGo想必会别有一番滋味在心头。

　　写于2016年3月9日夜

　　首先围棋和象棋包括国际象棋的致胜目标是完全不一样的。

　　象棋和国际象棋的目标是杀掉对方的王。对程序而言最傻的办法通过穷举法配合象棋的逻辑就可以不出错，因为目标是一个绝对量。

　　围棋的目标对于程序来讲是一个非常虚的概念，围棋的获胜方是要比输家占更大的地盘，是一个相对量。我哪怕比你多半目我就赢了。

　　所以对于围棋而言，对局的变化是在不断变化的。布局和定式对于中前期非常重要，只要布局和定式前期OK，就能赢。而这个时候，由于围棋的下子点足够多，计算量太大，电脑根本不可能靠穷举来下。而一旦进入中后期，随着棋盘上面的可下的位置的减少，所以可以通过计算来解决这个问题。

　　所以阿尔法狗这两天下的棋你可以看到，一旦中后期人类犯错和中后期人类不占优的话，以人类的计算力根本不可能干掉他。因为他的计算力比人类强大太多了。

　　要想赢阿尔法，必须找布局和定式非常强的人类来跟他玩，一定要在前中期解决战斗。而这两点，李世石在他那个层面的选手里面属于较弱的。李世石擅长的是僵尸流，也就是后期找漏，现在碰上一个比他还强力的僵尸流，就没法打了。

　　以上只是我个人的一个简单的判断。另外这两局也没看到阿发狗打劫的能力。所以这块不好讲。如果打劫阿法狗也能玩的毫无破绽。那就只有在布局阶段干死阿尔法。但是这点很难，因为通过这两天看到的情况，在人类选手布局阶段，他就上来死缠烂打进行肉搏了，所以局很难做。

　　已经很久没有关注过围棋了，李世石虽然目前在在役选手里面战绩最好。但是从围棋的历史上来看，他的僵尸流并没有对围棋做出太大的贡献。因为他的能力是强于计算。远点的吴清源就不说了，真正的大魔王。拥有开山立派的能力，近的藤泽秀行、包括年轻时候的聂卫平这方面能力都不弱。而近二十年来由于韩风日盛，在曹薰铉极其弟子的带动下，围棋在布局定式上变的毫无进步，大家都在比计算，有想法又能计算的太少了。原来还有一个不错的日本棋手赵治勋，也老了。

　　于是整个围棋运动陷入一个非常尴尬的境地。就是所有在役选手都没有勇气或能力去研究新的布局和定式了，而大家都在拼计算。因为大家觉的虽然研究出一个新的布局和定式能够大比分赢对方，但是也有可能大比分落败。在名誉和奖金面前，稳稳妥妥的赢就好，哪怕是赢半目。所以全在拼计算。

　　

　　

　　

回复[9]: 天才少年 ---AlphaGo之父 夏雨 (2016-03-12 14:42:07)

　　Demis Hassabis是谁？

　　----“AlphaGo之父。那台在围棋上下赢人类的机器背后男人的人

　　2016-03-11 18:28:19

　　

　　原标题：今夜，我们不谈人类未来，也不谈科技术语，只讲一个天才的故事

　　好了，我知道你的朋友圈、微博这两天都被那场“世界大战”——GOOGle 人工智能AlphaGo 和李世石的围棋比赛——刷屏了。在这段时间里，你或深或浅地了解到九段、李世石、柯洁、AI、蒙特卡罗树搜索、深度学习这些可能从未听过的名词，思考着电脑最终会不会控制人类、世界末日这些终极问题。但是，这篇文章不想谈比赛结果，不想谈人类未来，也不想谈我也不懂的科技术语，而只想讲一个天才——AlphaGo之父Demis Hassabis的故事。

　　天才少年，象棋大师

　　1976 年7 月27 日的伦敦北部，Hassabis夫妇——丈夫是希腊塞浦路斯混血，妻子是新加坡中国混血——迎来了他们的第一个孩子，一个男孩。他们都是老师，曾经开过玩具店，有着“像波西米亚人”般的性格，而且都不怎么喜欢新科技和计算机。在这么个家庭，走出继承父母衣钵或者从事艺术的孩子应该是一件大概率事件。

　　事实也正是如此。这对夫妻后来又生育了一男一女，他们长大后分别进入了写作和音乐领域，从事创作方面的工作。不过，取名为Demis的大儿子从小好像走的就是一条岔路：他4岁时开始下国际象棋，一年之后“在国内立于不败之地”，到了13岁，Elo等级分为2300分，是有史以来14岁以下组别分数第二高的孩子。需要解释一下的是，Elo等级分是国际棋联使用的等级分制度，拿到2300-2399分的人水平大概是棋联大师。

　　但Demis的天才并不只限于国际象棋领域。在使用国际象棋比赛赢得的奖金买了电脑后，他在计算机上一发不可收拾：8岁编写自己的计算机游戏；16岁完成“英国高考”后加入Bullfrog Productions游戏开发公司，在游戏《SyndiCATe》负责关卡设计；17 岁作为联合设计者和主力程序员开发出包含AI元素的经典电子游戏《主题公园》。不过，Demis并没有过早地把游戏开发作为自己的事业，而是在这个时候选择到剑桥学习计算机科学。

　　这大概就是神童的人生，gap year（间歇年）做出的游戏牛逼得催生了一种新类型游戏（管理模拟游戏，也就是大家平常玩的模拟医院、模拟城市之类的），然后回去上世界上最一流大学的最一流专业，而且和同学们也是一样的年纪。不想输在起跑线上？和Demis比，我们可能一辈子都到不了他的起跑线。

　　在游戏界的创业生涯

　　1997年，当20岁的Demis以计算机科学双重一级荣誉学位（double first）的成绩从剑桥毕业后，他和几年前一样选择了一家游戏公司任职，负责电子游戏Black &；White。在这个游戏里，玩家扮演上帝来控制几个村落，其中包含人工生命、策略和战争等等元素。但很快Demis就独立门户了：1998年创立了Elixir工作室，成为一名独立开发者。

　　在Elixir的几年中，虽然Demis设计的两款游戏《Republic: The ReVolution》（凝结着Demis 雄雄野心的、一个不走寻常路的政治模拟游戏）和《Evil GEnius》被提名英国“奥斯卡”，但却都没有得到大众的高评价：在Metacritic网站（类似于豆瓣网）的评分中，前者只有62分，后者则是77。

　　这并不是Demis想要的结果。2005年，Demis将游戏的知识产权和专利卖给了几个游戏出版商，关闭了工作室，重新回到了校园。而这一次，他把目光放在了认知神经科学上。

　　“21 世纪的阿波罗登月计划”

　　为什么是认知神经科学？因为大脑——人类智慧的象征——正是Demis可以为人工智能找到新算法的灵感源泉。在伦敦大学学院攻读博士学位时，Demis的主要研究领域是自传体记忆和海马体。前者指的是对个人复杂生活事件的混合记忆，后者则是人脑中负责储存短期记忆的部分。

　　经过几年的研究，Demis提出了关于情节记忆系统的新理论：场景构建是掩藏在回忆和想象中的关键过程。这种已经超越普通人常识水平的理论相信没多少人能看懂，反正这个理论就是被《科学》杂志（爱迪生创办的杂志，全球最权威的学术期刊之一）评为年度十大科学突破之一。

　　从神童成为创业者，再变成科学家，Demis的下一步没有多少人能看透。2010 年，他和在UCL读博士遇到的Shane Legg共同创办DeepMind并担任CEO，研究人工通用智能（AGI），而Demis把它形容为“21 世纪的阿波罗登月计划”。

　　大多数AI系统都是“狭隘” 的，训练事前编写好程序的代理来掌握某种特定的任务，它们并没有太多其他的能力了。……Hassabis站在另一边：他从人类大脑获取灵感，试图创造第一台“通用用途的学习机器”，一组灵活的、适应性强的算法，能够像生物系统那样只利用原始数据来学习如何从头开始掌握任何一种任务。

　　2014年，Google以4亿美元收购DeepMind，当时的他们没有产品只有论文，技术人员也仅仅有20位。不过很快DeepMind 就证明了它的价值：2015年2月，DeepMind在另一本一流科学杂志《自然》发表论文，介绍了能够通过学习成为雅达利（现代游戏机始祖）游戏高手的人工主体。

　　然后在2016年1月DeepMind再次发表论文，称他们的新算法AlphaGo在最困难的游戏——围棋——上也取得了巨大突破。而后来的事，你们应该都已经看过不下几百遍了。

　　最先进的人工智能背后也只是人

　　Demis Hassabis是个天才，这个论断就算是只知道他是那台在围棋上下赢人类的机器背后男人的人，相信也不会有很大的异议。不过，看着他谈到自己的理想、自己的童年、自己的孩子，你就会知道，他并不是什么企图溃灭人类的疯狂科学家（他希望人工智能能够在医疗、气候变化、金融等等领域发挥作用），也不是木讷的极客。不管Demis自己是否认同，他肩上担负的可能就是人类未来的某种希望。

　　每晚，Demis都会回到家里和家人一起吃饭聊天，之后陪两个儿子写作业玩游戏。在带完两个孩子上床睡觉之后，Demis会开始工作电话会议直至凌晨1点，之后用几个小时来进行思考。而在这些深夜的思考中，诞生的可能就是下一个颠覆全人类的想法。

　　

　　

　　

回复[10]: 北美华人谈Al与日本高手的走棋风格 夏雨 (2016-03-13 11:32:27)

　　AlphaGo对围棋观念有革命性颠覆。

　　职业棋手因为计算力的限制、多走的比较低位，先占领实地、比较好把握。过去武宫正树、加藤正夫、藤泽秀行这样高位棋手很少见、都被称为天才。

　　AI下的位置高，开局厚、然后直线攻击。像加藤正夫的棋。看着三盘棋前三十手、明显AI下的四路以上高位多、甚至很多处走了“先损”的高位。职业棋手愿意保留变化，但AI要简化局面，所以就走掉了。AlphaGo简直就像“刽子手”加藤正夫、“最安全运转”小林光一和“超级形势判断”李昌镐的合体。

　　形势判断一靠算得深、二靠棋手直觉天分，看来是AI模拟的逻辑算法“算的深”压倒了人类直觉（智慧？）。但AI还只是机器。现在它只会走厚实、加藤正夫的棋，因为逻辑算法胜率最高。人类却会有不同的风格，如吴、曹、马的快速，赵的低位，木谷实、大竹龟步，李昌镐林海峰的忍耐等等。

　　

　　

回复[11]: 这盘棋已经让人类“绝望” 夏雨 (2016-03-13 11:42:47)

　　

　　

　　3月12日，在“人机大战”的赛点面前，拼尽全力的李世石依旧无法力挽狂澜，第176手投子认输。提前输掉比赛的同时，也让更多人叹服AlphaGo带给围棋领域的震撼。

　　韩国棋迷开始叫AlphaGo“老师”，而韩国棋手金志锡更是感叹，它可以让人类两子。仅仅三场比赛，AlphaGo代表的人工智能已经让人们折服于它不断演进的强大和超出想象的创造力。

　　AlphaGo俨然太极高手

　　在结婚十周年纪念日面临赛点，心情复杂的李世石没有带女儿来到赛场。他尽量表现得轻松。实际上，10日晚输掉第二盘后，他与好友，棋手洪旼杓和朴正祥彻夜研究，期待“开劫争胜”和“大模样作战”，尽管谷歌方面表示既没有传闻中不准打劫的保密协议，而AlphaGo也并非不会打劫。

　　

　　

　　

　　在四季酒店的观棋室里，韩国棋迷们开始把AlphaGo称作“老师”，因为它的奇招不但令聂卫平等顶尖职业选手“脱帽致敬”，也令普通棋迷叹为观止。

　　就像第二盘中，AlphaGo如天外飞仙般的第37手棋，在很多人看来都颇具创造性的意味。而开发AlphaGo的DeepMind的巩固学习研究小组负责人David Silver认为，AlphaGo模拟计算认为人类在对弈当中会下出来这手，只是计算机对围棋的思考速度超过了人类对围棋的思考速度。

　　换句话说，李世石是在和一个已经超越当今围棋理解的AI对弈。这也令人想起了，日本围棋大家藤泽秀行的名言——棋道一百，我只知七。

　　果不其然，AlphaGo不按套路行棋，它的布局再次让人们看不懂，颠覆了人类固有的围棋思维。而背水一战的李世石从第15手就开始主动进攻。不过每一次强悍的进攻，都会被AlphaGo轻松应对消弭于无形。它就像个太极高手始终让李世石无法成功发力。

　　或许能让人类两子

　　棋局开始2小时不到，柯洁已经判定李世石回天无术，“基本可以判定李世石死刑了，这棋让我下李世石的棋也没机会了。”

　　AlphaGo的棋着从不硬碰硬，即便李世石缠着它一通乱战，但总能掌控住全局。“AlphaGo每一招都是正招，很可怕。”

　　人类棋手有时候已经很难直接领悟AlphaGo的谋划。它在右上角俗手连发，原来是为了令人震惊的一手104手，它甚至知道如何先手借用了。简单来说，就是AlphaGo已经懂得项庄舞剑意在沛公，白棋无意强杀左上角，只是想先手借用，使左上白大龙彻底摆脱后顾之忧。

　　

　　李世石赛后参加记者会时一脸无奈

　　

　　“这盘电脑下的太好了，而且一开始就看不出电脑的痕迹。我感觉作为人类我都有点绝望了，更何况是人类代表李世石呢？这三盘一盘输的比一盘快，这盘又是明显吊打。”唐韦星七段也感叹绝望的是找不到AlphaGo的漏洞。

　　棋至3小时27分，李世石已无力回天。“就像是第一个去太空的人类，就算死在太空也为人类做出了重大贡献。这也算是对此次人机大战的总结吧。”唐韦星说道。

　　脸憋得通红的李世石在局部试图造劫，并形成打劫，而AlphaGo也在面对人类的历史上第一次提劫。李世石用行动证明，没有不许打劫的秘密协议。AlphaGo也表现出了不俗的找劫水平。过往两盘，它只是避免陷入劫争。

　　通观“人机大战”三场，职业棋手们不得不叹服，AlphaGo在围棋上的造诣。

　　“尽管有幻想人工智能的弱点，但这盘棋很有可能让人类绝望。”韩国棋手宋泰坤九段道出了心声，而韩国的金志锡九段甚至说，人类可能要被AlphaGo让两子。

　　柯洁：AlphaGo是实力上的碾压

　　AlphaGo轻松拿下比赛，颠覆了所有棋手赛前的猜想。19岁的围棋世界冠军柯洁九段说道：“在比赛之前，觉得李世石肯定没问题，赢到最后放放水让AlphaGo赢一盘，真的未曾想到会是这样。AlphaGo的出现对于职业围棋选手真的很震撼，很多选手凭借天赋和勤奋修炼到现在这样，但现在最优秀的选手李世石被打得毫无还手之力，完全是实力上的碾压。”

　　第三盘AlphaGo无论是在全盘还是局部，都完胜李世石，即便在劫材上也展现了惊人的能力。“之前我还说李世石是不是签保密协议了，但是从这三盘来看，我觉得李世石的压力真的很大，而且这种压力是每一步棋对方都比你下得好。”柯洁感叹道：“所以我之前也是开玩笑为主，李世石和谷歌都不会干这种事儿的。谷歌是什么样的公司你们知道，李世石是什么样的棋手我们围棋界都知道，他是什么样的一个棋手呢？举个例子说是一条猎狗，咬住猎物就不松口，直到对方认输。”

　　谈及自己对阵AlphaGo，柯洁也开起了玩笑，“之前我说自己对阿法狗有至少6、7成的胜率，现在的话，最多只有6、7成的胜率了，当然，可能也有一点吹牛的成分。”

　　人类棋手还能战胜AI吗？至少古力九段有些悲观。“一个团队还行，一个人的话够呛，至少得5个9段！”古力说，“巅峰时期的李昌镐、吴清源都不一定能战胜AlphaGO，现在的柯洁其实更强，但也难赢。”

　　

　　

　　

回复[12]: 10年后--你我都看得到的 夏雨 (2016-03-13 12:05:16)

　　谷歌专家：“天网”10年后就可能出现。

　　(注：天网Skynet是电影《终结者》中的人工智能系统，拥有自我意识之后开始毁灭人类)

　　

　　就在第二局比赛之前，谷歌一位资深人工智能工程师接受了新浪科技驻美记者的独家专访，就此次比赛以及人工智能的前景发表了他的看法。由于未获允许接受采访，他不便透露具体身份。需要再次强调的是，此次采访是在旧金山时间周三傍晚进行的，当时他还不知道比赛进程，更不知道李世石会再度告负。

　　问：此次比赛是人工智能的里程碑吗?

　　

　　

　　

　　答：这次比赛是人工智能领域的一个重要里程碑事件，因为研究人员已经从事围棋计算机程序研究数十年了。20年前，计算机在国际象棋领域击败了人类(注：1997年IBM的深蓝击败世界冠军卡斯帕罗夫)。20年后，电脑程序在围棋上也超越了人类。而此前很多研究人员还认为这至少还需要十年时间。围棋是此前仅存的人类能够击败电脑的完全信息博弈游戏(Perfect Information Game)。

　　问：谷歌人工智能团队有多少人?

　　答：实际上，谷歌并没有一个叫做人工智能团队的部门。谷歌目前有两个主要团队负责深度学习的研究工作，包括谷歌大脑(Google Brain)以及这次参赛的DeepMind。AlphaGo项目是主要由伦敦的DeepMind团队负责的。我不能透露具体信息。Facebook现在也有一些研究人员在从事同样的项目。

　　问：我们是否可以说李世石的对手不只是AlphaGo，而是整个谷歌人工智能的实力?

　　答：不是这样，此次李世石的对手是DeepMind的AlphaGo团队。AlphaGo是为围棋比赛开发的，而谷歌的其他机器学习团队都在使用不同的技术，从事不同的项目。

　　问：此次比赛过程中，谷歌总部团队为AlphaGo提供了怎样的支持?

　　答：只是确保AlphaGo与谷歌的服务器连接顺利。前方也担心比赛过程中互联网连接出现问题，所以准备了备选方案。

　　问：那你们怎么看待第一场比赛的胜利?这是意料之中还是意料之外的?

　　答：自从去年12月比赛以来，AlphaGo的能力已经得到了明显的提升，我们对此次比赛的胜利是基本预料之内的。我们很多人都认为AlphaGo会赢得比赛，很高兴看到这一切正在变成现实。

　　问：你们预计未来几局战局如何?

　　答：AlphaGo很大可能会五局全胜。

　　问：中国世界冠军柯洁表示，即便AlphaGo可以战胜李世石，也无法战胜他。

　　答：我不懂围棋，不知道他是谁。即便他是当今围棋的第一人，即便现在AlphaGo不是柯洁的对手，也只需要三个月时间就完全可以击败他。

　　问：那么人工智能何时可以达到撰写小说的程度?

　　答：这很难说，我估计10年之内可以实现。

　　问：围棋被认为是人类棋牌游戏的智能巅峰。这次AlphaGo取胜是否意味着人工智能已经超越人类智能?

　　答：不是这样，人类智能包括很多方面。棋牌游戏只是其中很小的一部分能力。举例来说，目前人工智能依然无法在多玩家同时对战的德州扑克游戏中稳操胜券，也无法在股市这样的无法获知玩家信息的游戏中取胜。他们也无法做到品尝食物这样的人类基本能力。

　　问：那么人工智能还需要多久才能对人类智能占据明显优势?

　　答：在ImageNet计算机视觉识别挑战赛，人工智能已经在图像分类(物体识别)上接近了人类，这其中的挑战只是从一张图像中分析1000种可能性来判断物体。我觉得未来10到15年，人工智能可以接近人类级别的一般智能水平。要实现这个目标，自然语言是需要克服的一大障碍。

　　问：那么人工智能的下一个里程碑是什么?

　　答：正如我此前所说，下一个里程碑就是自然语言理解，包括更好的理解书写文字以及搜索查询的问题。

　　问：伊隆·马斯克(Elon Musk)担忧未来人工智能可能会无意被用于邪恶，甚至毁灭人类。你怎么看待这种天网存在的可能性?

　　答：我认为随着强人工智能(AGI)时代的到来，这是可能的。但目前人工智能的能力还太有限，距离这个可能性还太远。我估计，再过10年这个问题会成为可能。(注：天网Skynet是电影《终结者》中的人工智能系统，拥有自我意识之后开始毁灭人类)

　　问：机器到时候会拥有自我意识吗?

　　答：目前人工智能依然处在非常早期的阶段，没人知道未来某天机器是否会具备自我意识的能力，乃至更加不可预测的后果。从理论上来说，马斯克的担忧是完全可能的。而这就是马斯克做OpenAI的目的，制定人工智能的道德准则，确保未来人工智能不会被误用于邪恶的目的。

　　问：那你怎么看待马斯克创办的OpenAI机构?

　　答：我认为保持人工智能研究的开放性和向大众开放是有意义的。他们拥有很多非常杰出的研究人员，包括此前谷歌大脑的一些成员。我很期待看到他们在未来会有怎样研究的成果。

　　问：如果有一天真的出现可怕的后果怎么办?

　　答：我希望到时候自己的大脑已经融入电脑，人和电脑合为一体。

　　问：你的身体呢?

　　答：(笑)储存起来，需要的时候再用好了。开个玩笑。

　　

　　

　　

回复[13]: 判若两人！ 老唤 (2016-03-13 23:48:52)

　　说的是第四局的Alphago。

　　与前三局的谨慎，即精妙计算和斤斤计较不同，它变成了一个大大咧咧的野心家！这是为什么？

　　至少有三次机会能迅速结束战斗，却为了几目的收官而放弃了几十目的大屠杀！

　　难道是出于某种目的加入了新的人工的因素？不可思议！

　　

回复[14]: 采夫 (2016-03-14 00:21:27)

　　今天从开局就在观战，到4点在众人一片绝望声中出了门。因为开展几步后，啊老师就把可怜的李世石按住了、、、

　　回来一看，竟是李赢了。

　　

　　要说李不愧是世界顶尖棋手，这回他开始收得像乌龟，然后放出胜负手、、、可怜的计算机这回傻眼了，有说是检索不到对策死机了，反正昏招连出、、、

　　

　　看来，啊老师还是有死穴的麽！

回复[15]: 骏骏 (2016-03-14 10:02:35)

　　残酷的纪念日：10年前的今天李世石结婚了

　　

　　3月12日这一天的栏目，将首次撇除棋谱，讲述事件。3月12日这一天，不能不谈李世石。

　　

　　那时候，李世石还是那个无论言行都屡屡让我们吓掉下巴的“疯狂的石头”。

　　那一年2月份，李世石将秘而不宣的恋情公诸于众，并确定了3月12日为婚期。然后小李尴尬的发现，3月的11和13日，是春兰杯前两轮。换做常人这么冲突的日程势必要弃权了，然而小李不是常人。李世石的应对办法极其简单粗暴，那就是买张11日下午六点半回韩国的机票。

　　大概是老天也被小李的选择吓得退避三舍，首轮抽签，李世石居然对上了堪称全场最弱的欧洲选手卡塔林五段。11日比赛开始，小李直接拎着行李箱杀进对局室，开局高举高打落子如飞意图速推对手，局面直奔爆冷的节奏而去。幸而对手毕竟实力不济，下午续战后濒临败北的小李利用对手角部的劫争（是的，打劫）成功翻盘，两点刚过便结束对局。

　　12日上午11时，在亲朋师友的祝福声中，李世石与妻子金贤珍的婚礼如期举行。礼毕小李携夫人共赴机场，于当晚八点半抵达北京。13日春兰杯第2轮，李世石中盘战胜罗洗河。

　　这是小李巅峰时代的一幕经典缩影。疯狂、豪赌、肆无忌惮，与时间、赛程、对手等等敢于阻碍他的一切赛跑、狂飙，并在绝大多数时候总能获得胜利。那时候的李世石还年轻，有着取之不尽的棋力去棋盘前兑换成冠军和奖金，用之不竭的体力在中韩之间飞来飞去。那时候口无遮拦，随性而为，在欧洲棋手面前怎么zuo都不会die的李世石，万万不会想到，整整十年后，在他的结婚十周年纪念日上，他将被一款欧洲人研发的围棋AI，逼上绝境。

回复[16]: 怎樣打敗AlphaGo 夏雨 (2016-03-14 13:53:12)

　　作者: h “怎樣打敗AlphaGo？（：）” 2016-03-13 17:31:11

　　李贏了第四局，譽聲四起（：）是李贏了嗎？不是，事實是AlphaGo輸了，不是李贏了。（：）此話怎講？

　　對計算機稍有常識的人都知道計算機是非常笨的，你的程序叫它做什麼，它就做什麼，程序沒有，它就笨得連孩子都不如。

　　AlphaGo現在所以厲害，它有一個超過人類記憶幾千倍的數據庫，在這個數據庫中包含了差不多所有名家的對局， AlphaGo總是可以從類似對局中找到對策。所以李到處吃虧。

　　要打敗AlphaGo 可以這麼辦!

　　先將AlphaGo引誘到非常笨的思路上去，等它已經亂七八糟的時候再對付它。（：）

　　所以先要下笨棋，臭得讓AlphaGo在它的數據庫中無據可查，開始胡說八道，（：）

　　等它已經完全開始亂了了，抓住機會在它反映過來之前，將它消滅掉（：）

　　我是棋外行，獻上此法，能用就用，不能用也不要罵我，就當我沒說（：）

　　

　　close全部跟贴

　　博讯螺杆 “这个有可能，Al光是自我博弈总结出的棋局就3000多” 2016-03-13 19:47:25

　　经验棋局储存了多少就更不用说了。它应该是通过快速运算找到自己储存的经验对策，如果对方不按规则出棋，它的硬盘里没有相应对策，那就很可能无所适从了。至于越南人网友说的神经元系统，我认为有点玄，人工智能真若是发展到这个水平，那就太可怕了。

　　

　　越南人 “臭棋是没用的,事实上李说他走的那步棋是关键一步” 2016-03-13 17:39:00

　　在关键一步，alphaGo没认清--认为那无关痛痒。

　　但几步棋之后，alphaGo就认清形式了，但晚了。

　　

　　h “到了那個份上，是臭棋，是妙棋，已經無法說清楚了（：）” 2016-03-13 17:50:30 如果一開始，讓alphaGo在庫中找不到先例，臭對臭，開始胡說，然後繼續引，等它完全不知怎麼辦時，對付他

　　

　　越南人 “哪个人工智能都要先能打败随机策略--随机策略就是最大的臭棋” 2016-03-13 17:54:53 而有深度的棋必定是看到步数越多越好,能下出有深度还有新意的棋---早就是九段了吧。所以：要走出高度创新，牵一发而动全身境界的棋--才能胜

　　

回复[17]: 采夫 (2016-03-15 11:52:22)

　　如果啊老师是个顶级水平的赵括，那李将军就坚持不按兵法排兵、、、

　　

　　上次执白龟缩，胜算。这次主动要了黑，会不会乱放枪，冷不留出颗流弹把啊老师挂了？哈哈！

回复[18]: 呵呵第5盘就更精彩了 夏雨 (2016-03-15 12:50:25)

　　 zt阿尔法狗采用的是门特卡罗树算法，是具有学习能力的

　　机器会根据不同的棋局学习到新的判断因子，来补充它的算法。

　　从这个意义上讲，阿尔法狗是具有半智能的，因为它可以改进它的算法。

　　人工智能有一个理论上的奇点，即人工智能程序能否设计出一个比它自己更完善的程序。如果这个能成立，人工智能就可以脱离人类自行发展。

　　阿尔法狗离这个还很远。

　　

回复[19]: 我的解释和猜测 夏雨 (2016-03-15 13:48:17)

　　zt我们要解释，为什么AlphaGo下了错误的83。　

　　这个局面特别复杂，把整个棋盘中间都卷进去了，可以说根本不是地块划分的问题。决定性因素就是怎么出棋，出多大的棋，出劫的话怎么造对自己有利的劫。

　　从AlphaGo的算法来看，它会从当前这个局面进行搜索展开，对叶子节点给出判断。一半是靠价值网络，一半是靠“快速走子策略”走到终局。

　　价值网络的意思是，它静态地看整个盘面，用一个多层的神经网络直接算，就报告这个局面谁会胜。虽然它能“深度学习”到很多隐藏的概念，我们很难想象，在一个火药桶一样的盘面上，一个静态的不搜索的神经网络居然可以判断清楚最终的胜负。

　　这种复杂局面，我断定价值网络的判断误差是极大的。也许价值网络在各种叶子节点粗粗地一看，黑棋在中间以多打少似乎应该是形势一片大好。这应该不难理解，无论谷歌怎么拿几亿个局面训练价值网络，我也不相信它能判断清楚。　

　　那么AlphaGo在叶子节点还有一半的机会，就是“快速走子”你一招我一招不停直到终局。这个快速走子策略的实力还不错，速度比策略网络快1000倍的情况下，单只靠这个策略就有KGS的3D实力，做得其实很好了。但我们再想想，这么复杂的盘面，两个KGS的3D在那下到终局，你信得过它们的模拟质量？黑死还是白死估计就是随机的了。如果让两个真实的人类3D在这个局面下，黑好白好确实可能等于扔硬币。

　　如果“快速走子终局”给的结果是随机，基本就是价值网络在那主导判断了。它要是有系统性的错误偏向，误以为黑形势一片大好，那可能一大堆叶子节点都有类似错误，因为盘面很相似。所以综合起来，AlphaGo的MCTS模块，让价值网络在那高兴，下了83和85还是继续高兴，胜率还是70%。终于在白下了86，黑87后，价值网络发生了“跳变”，这里出现了棋块特征的本质变化，一大片类似叶子节点的价值网络判断都倒转过来，于是只一手，胜率就从70%跳到30%之类的悲惨数字了。　

　　这是我的猜测，只能尽量地往合理上靠，最终如何希望Deepmind能给出分析。但是显然，复杂的对杀盘面会对价值网络造成严重困扰，这应该是AlphaGo体系架构中一个不太好消除的命门。同时复杂的对杀盘面，又让“快速走子策略”模仿精度下降。要是两个3D在那下和平棋终局，你占10目我占9目，错进错出最后一平均是可能把局面好坏概率性模拟清楚。但要是50-50%机会的大对杀，就和其它地方无关了，模拟到最后也提供不了什么有效信息。　

　　AlphaGo搜索中的两个武器都失灵了，就只有依靠“策略网络”提供的各个候选点的概率了。同样的原因，这个策略网络只是一个静态评估，复杂盘面各处头绪很多，各种要点多得是，看上去的好点到处都是。我不相信策略网络就那么凑巧对真正的好点给出高的概率。　

　　可以非常合理的认为，对于复杂的、头绪很多的对杀盘面，AlphaGo所有的搜索武器都会失灵，容易做出错误选择！三大搜索武器“策略网络”、“价值网络”、“快速走子终局数子”，全都失灵！（观察者注：关于AlphaGo三大利器，田渊栋的这篇《AlphaGo的分析》做了很好的科普，作者为前谷歌工程师，Facebook智能围棋 darkforest 的负责人和第一作者）都失灵了，不管你怎么调参数拼凑一个MCTS架构，最后也还是失灵。这就是AlphaGo的命门！

　　让我们人类开心的是，这并不是很难实现的！我和Zen下过，水平不够怎么也下不过它。要么局部被它杀死，要么圈地大局观搞不过。但是下多了，慢慢也琢磨出来了办法。就不要怕它，这里开一片头绪，那里开一片，留着不动。然后各种头绪慢慢凑一起，这里的选择会影响那里。这种情况下Zen就昏了，它的搜索武器其实比AlphaGo更差，更是全都失灵了。我虽然也昏，但就死盯着某一个“阴谋”，设计一条路线图就够了，不去搜索那么多乱七八糟的。最后哈哈，Zen上当了，我阴谋得逞，吃了一大片终于赢了。其实我的水平真的远不如Zen，各个局面手段和大局明显不如。　

　　那么对李世石这样的职业高手来说，复杂盘面更不是个事了。职业高手能理清楚复杂盘面的推理逻辑，用清楚的变化图给出杀招。这正是体现大高手水平的地方。因此我大胆推测，AlphaGo其实没有那么可怕。所有MCTS为基础的程序都有的大漏洞，它一样有，而且从算法角度没有什么好办法解决！这是算法原理决定的，不是写程序代码错了几行的小bug。

　　如果职业高手们了解了AlphaGo的漏洞，就不要客气搞什么棋理圈地，直接就上去跟它杀！但不要在局部乱杀，不是说“在此决一胜负”，如李世石第一局开始的杀法，不对。要这里留点味道，那里留些头绪，最后这些乱子凑到一起去，一定把AlphaGo弄昏头。（观察者小编：这里一点，那里一丝，留有余味。人类的暧昧啊，阿尔法狗暂时还学不会）

　　因此，除了“不喜欢打劫”以外，AlphaGo还不喜欢复杂的盘面。所以前三局中它表现得特别喜欢定型，有手段就使出来，减少头绪。这是它的搜索特性决定的。　

　　分析清楚以后就可以肯定，AlphaGo的漏洞不小。开始人类不了解它，看它下得象模象样，还时不时有好招，被它吓到了，没有找到它的命门。它是有几招绝活玩得不错，封闭局面算得不错，圈地运动搞得不错，几百万次算到终局去人不可能玩得过。选点也很靠谱，算得快算得准。在它擅长的领域和它打，当然就不是对手，哪怕是人类最高水平的也不行。但复杂盘面是人类的天生优势，这不是MCTS那几招搞得定的，需要人类高手制造头绪归纳头绪的逻辑能力。AlphaGo的缺陷被测试出来以后，人类高手将可能对机器取得压倒性的胜利。当然人类高手需要改变下法，不要和自己人下那样讲棋理数着目下。碰到机器就要搅，越复杂越好。不是一处变化多手数多那种复杂，而是搅出的头绪越多越好。

　　这还没有提到打劫的能力，这更是人类高手胜过机器的地方。机器可以用控制流避开劫争，但这终究不是办法。如果人想通了，自己不要虚，大胆引入劫争分支，机器总是避劫原理上就不合于棋道。当然这个分析起来更复杂。综上所述，如果高水平围棋程序还是基于MCTS架构的，都会有难以解决的大缺陷。我对人类高手一段时间内压制机器充满信心 -

回复[20]: 一张图解AlphaGo原理及弱点 怎么 (2016-03-15 17:19:24)

　　一张图解AlphaGo原理及弱点

　　

　　文/郑宇张钧波（微信公众号：CKDD）

　　作者简介

　　郑宇（博士、教授、博士生导师）微软亚洲研究院主管研究员、城市计算领域负责人， Editor-in-Chief of ACM Transactions on Intelligent Systems and Technology，2013年被MIT Techology Review评委全球杰出青年创新者（MIT TR35），ACM数据挖掘中国分会秘书长。

　　张钧波（博士），微软亚洲研究院副研究员、城市计算组成员，从事深度学习领域的研究。

　　近期AlphaGo在人机围棋比赛中连胜李世石3局，体现了人工智能在围棋领域的突破，作为人工智能领域的工作者，我们深感欣慰。其实质是深度学习网络（CNN）跟蒙特卡罗搜索树(MCTS)结合的胜利，是人类智慧的进步。不少所谓的“砖”家开始鼓吹机器战胜人类、甚至人类将被机器统治等无知言论，让人实在看不下去。作为围棋爱好者和人工智能领域工作者，我们觉得是时候跟大家讲讲AlphaGo的原理及其弱点了。

　　可以很负责任的告诉大家，AlphaGo还没有完全攻克围棋这个难题，职业棋手也并非没有希望赢Go了，更不能说机器战胜了人类。AlphaGo未来需要走的路还很长。如果有中国职业棋手想挑战AlphaGo，我们愿意为其组建最顶尖（且懂围棋）的人工智能专家顾问团，助其取胜AlphaGo。

　　虽然网上技术贴不少，但还没有一篇文章完全讲清楚AphaGo的原理，Nature上刊登的文章也缺乏一张刨解全局的图（加之用英文描述，同学们很难理解透彻）。以下是我跟微软亚洲研究院的张钧波博士在多次阅读原文并收集了大量其他资料后，一起完成的一张图，解释了AlphaGo的原理，看完后大家自然知道其弱点在何处了。

　　图1、AlphaGo的原理图 (作者为本图花费大量心血，版权归两位作者所有，欢迎转发，但请勿盗图)

　　AlphaGo总体上包含离线学习（图1上半部分）和在线对弈（图1下半部分）两个过程。

　　离线学习过程分为三个训练阶段。

　　第一阶段：利用3万多幅专业棋手对局的棋谱来训练两个网络。一个是基于全局特征和深度卷积网络（CNN）训练出来的策略网络（Policy Network）。其主要作用是给定当前盘面状态作为输入，输出下一步棋在棋盘其它空地上的落子概率。另一个是利用局部特征和线性模型训练出来的快速走棋策略（Rollout Policy)。策略网络速度较慢，但精度较高；快速走棋策略反之。

　　第二阶段：利用第t轮的策略网络与先前训练好的策略网络互相对弈，利用增强式学习来修正第t轮的策略网络的参数，最终得到增强的策略网络。这部分被很多“砖”家极大的鼓吹，但实际上应该存在理论上的瓶颈（提升能力有限）。这就好比2个6岁的小孩不断对弈，其水平就会达到职业9段？

　　第三阶段：先利用普通的策略网络来生成棋局的前U-1步（U是一个属于[1, 450]的随机变量），然后利用随机采样来决定第U步的位置（这是为了增加棋的多样性，防止过拟合）。随后，利用增强的策略网络来完成后面的自我对弈过程，直至棋局结束分出胜负。此后，第U步的盘面作为特征输入，胜负作为label，学习一个价值网络（Value Network），用于判断结果的输赢概率。价值网络其实是AlphaGo的一大创新，围棋最为困难的就是很难根据当前的局势来判断最后的结果，这点职业棋手也很难掌握。通过大量的自我对弈，AlphaGo产生了3000万盘棋局，用作训练学习价值网络。但由于为其的搜索空间太大，3000万盘棋局也不能帮AlphaGo完全攻克这个问题。

　　在线对弈过程包括以下5个关键步骤：其核心思想实在蒙特卡洛搜索树（MCTS）中嵌入了深度神经网络来减少搜索空间。AlphaGo并没有具备真正的思维能力。

　　1. 根据当前盘面已经落子的情况提取相应特征；

　　2. 利用策略网络估计出棋盘其他空地的落子概率；

　　3. 根据落子概率来计算此处往下发展的权重，初始值为落子概率本身（如0.18）。实际情况可能是一个以概率值为输入的函数，此处为了理解简便。

　　4. 利用价值网络和快速走棋网络分别判断局势，两个局势得分相加为此处最后走棋获胜的得分。这里使用快速走棋策略是一个用速度来换取量的方法，从被判断的位置出发，快速行棋至最后，每一次行棋结束后都会有个输赢结果，然后综合统计这个节点对应的胜率。而价值网络只要根据当前的状态便可直接评估出最后的结果。两者各有优缺点、互补。

　　5. 利用第四步计算的得分来更新之前那个走棋位置的权重（如从0.18变成了0.12）；此后，从权重最大的0.15那条边开始继续搜索和更新。这些权重的更新过程应该是可以并行的。当某个节点的被访问次数超过了一定的门限值，则在蒙特卡罗树上进一步展开下一级别的搜索（如图2所示）。

　　图2、MCTS拓展下一级节点

　　AlphaGo的弱点在哪里？

　　1. 攻其策略网络，加大搜索空间。进入中盘后，职业选手如能建立起比较复杂的局面，每一步棋都牵连很多个局部棋的命运（避免单块、局部作战），则AlphaGo需要搜索空间则急剧加大，短时间内得到的解的精度就会大打折扣。李世石九段的第四局棋就有这个意思。此处左右上下共5块黑白棋都相互关联到一起，白1下后，黑棋需要考虑很多地方。很多地方都需要在MCTS上进行跟深入的搜索。为了在一定的时间内有结果，只能放弃搜索精度。

　　图3、李世石对AlphaGo第四盘棋棋谱

　　2. 攻其价值网络，万劫不复：AlphaGo的价值网络极大的提高了之前单纯依靠MCTS来做局势判断的精度，但离准确判断围棋局势还有不小的差距。神经网络还不能完全避免在某些时候出现一些怪异（甚至错误）的判断，更何况其训练样本还远远不足。这也是为什么有了价值网络还仍然需要依靠快速走棋来判断局势。大家都曾经怀疑过AlphaGo的打劫能力，也感觉到了AlphaGo有躲避打劫的迹象。实际上南京大学的周志华教授曾经撰文指出打劫会让价值网络崩溃的问题，原理不再重复。总之打劫要乘早，太晚了搜索空间变小，即便价值网络失效，还可以靠快速走棋网络来弥补。开劫应该以在刚刚进入中盘时期为好（太早劫财还不够），并切保持长时间不消劫，最好在盘面上能同时有两处以上打劫。没有了价值网络的AlphaGo其实水平也就职业3段左右。

　　

　　

　　

图1.

　　

图2.

　　

图3.

回复[21]: 骏骏 (2016-03-15 18:27:19)

　　4:1，结束

回复[22]: 具有第一意识‘我’的量子计算机 夏雨 (2016-03-22 21:24:07)

　　

　　文章标题: AlphaGo已经掌握了人类思维精髓(ZT) 时间: 2016-3-22 周二,

　　

　　

　　五场对弈，凭借着4：1战胜李世石，AlphaGo的排名积分来到了3586分，仅次于中国棋手柯洁。这也意味着，如果想在围棋界称王，挑战柯洁将成为绕不过去的一环。

　　事实上，第四战结束后，AlphaGo的研发工程师拉利亚·哈德赛尔就在Facebook上写下了战书：“柯洁，准备好一场比赛了吗?”几天之后，得到回应。19岁的柯洁用惯有的语气在微博上写道：咱能动手就尽量别废话。同时，贴上了哈德赛尔的战书截图。

　　硝烟再起，似乎又一场“世纪大战”一触即发。然而，在不少专家看来，哈德赛尔和柯洁的隔空喊话，更像是谷歌的一场公关秀。因为找高手下棋，更多是为了验证AlphaGo的自学水平。

　　TA学到什么地步，没人知道

　　表象下的AlphaGo只是一台台式电脑，在整场对弈中，它只能安静地杵在边上，需要落子时，才由研发者之一黄士杰来执行。于是在连赢两局后，就有中国网友调侃，愤怒的李世石一气之下将AlphaGo砸碎，发现柯洁正躲在黑暗的机箱里。

　　AlphaGo的名声大振始于今年1月27日。当时，国际顶级杂志《Nature》以封面论文的形式对它进行了报道，并记录了去年10月5:0击败欧洲棋王樊麾一事。

　　《Nature》杂志的高级编辑坦吉·肖尔德在此前接受媒体采访时说，AlphaGo是“深度学习神经网络”与“蒙特卡洛树搜索算法”结合上的关键进展，它的基本概念在原理上可以解决人工智能的各类问题。

　　虽然这期杂志的问世引来了不少争议，有人认为那篇论文属于典型的《Nature》式炒作体，因为深度学习和蒙特卡洛算法在人工智能领域中的引用并不新鲜，不过这篇论文依然得到了学术界和产业界的认可。

　　Facebook人工智能组研究员、美国卡耐基梅隆大学机器人系博士田渊栋曾对DeepMind团队发表在《Nature》上的论文做过分析，他认为，这整篇文章价值在于它是一个系统性的工作，而不是一两个小点有了突破就能达到的胜利。

　　时下，AlphaGo颇为人津津乐道的是它对于neural network(神经网络)的应用。

　　中山大学人机互联实验室主任翟振明教授在接受南方日报记者采访时表示，70年前有学者建立了“神经网络”数学模型，但是到目前为止，发挥效应最大的就是此次人机大战。通过软件模仿来建构人工的神经元，就像给计算机安装上一个充满神经元的“大脑”。

　　“这些人工神经元，有输出端、有输入端，关键是相互之间的联通及由此产生的非线性累积迭代。”翟振明说。不过，由于人工神经元网络的无序性，输入进去的数据便很难追踪，这也就意味着，即便是研发者也不知道它们到底学到了什么样的水平。

　　“所以，他们要到处找人下棋，因为他们自己也不知道AlphaGo到了一个什么水准。”科大讯飞研究院副院长魏斯在也向记者表达了同样的观点。

　　TA的风格，不是优柔寡断

　　众所周知，AlphaGo的神经网络有两个，即策略网络(Policy Network)和估值网络(Value Network)。

　　DeepMind的CEO哈萨比斯在此前介绍AlphaGo研究进展时说，AlphaGo不是做穷举计算，策略网络负责落子选择，将理论上存在的 200种可能的棋步缩小到三四种得分最高的可能，从而减少计算的宽度，不用去计算所有落子可能;价值网络则负责评估落子后的局面和最终胜负的概率关系，从而减少计算的深度，不用徒劳地尝试算到底。

　　田渊栋在介绍Facebook的围棋人工智能时则坦言，他们的程序没有后者，而正是后者的引入，AlphaGo棋力得到了大规模提升。它让AlphaGo可以一边推算落子，一边判断局面。

　　除了上述两个网络之外，蒙特卡洛算法的应用也颇值得关注。这一算法可以将棋局和数据库上的信息放在一个概率函数上，这样AlphaGo就不用对每一步棋都给以同样计算量，然后可以对某些棋步作重点分析。

　　与人工神经网络一样，蒙特卡洛算法也有70年历史，进入21世纪之后，研究者们开始探索“蒙特卡洛树搜索”的全新思路，日本的ZEN和法国的CrazyStone都是在“蒙特卡洛算法”的思路上不断改进的代表。

　　它以蒙特卡洛城来命名。蒙特卡洛位于地中海之滨，属于摩纳哥公国，为世界三大赌城之一。除了蒙特卡洛算法之外，还有拉斯维加斯算法，两者都属于一种随机算法。

　　科普作家苏椰解释，拉斯维加斯算法可以总结为“尽量找最好的，但不保证能找到”，而蒙特卡洛算法则可以理解为“尽量找好的，但不保证是最好的”。这也意味着，如果AlphaGo选用前者，那么因为可能找不到最优解而陷入无法落子的尴尬局面;选用后者，则可能因落子并非最佳选择，而导致输棋。

　　不过，科学家最终选择了蒙特卡洛算法，因为没有永远的最好。另外，蒙特卡洛算法的规律也说明，采样越多就越能给出最优解，疯狂采样对于机器来说，从来不是问题。苏椰就笑称，在引入蒙特卡洛算法之前，“机器围棋的水平几乎是个笑话”。

　　中国著名围棋手江铸久九段曾多次与人工智能对弈，据他讲述，在以前，只要在棋盘上丢几个弃子，人工智能就会傻乎乎地围着那几个弃子转。

　　TA的“直觉”，得靠学习

　　AlphaGo的学习能力令人吃惊，据了解，它曾研究了围棋的三千万种可能，如果按照常人每半小时下一盘的速度，这三千万种如果要学完大概需要 1700 年。不过AlphaGo在学习过程中，只要两微秒就可以走一步，这样，三千万种棋路在很短时间内就可以学成，而且从不疲倦。

　　AlphaGo的惊艳表现也让很多人看到了“直觉”的影子。魏斯在接受记者采访时就盛赞AlphaGo似乎有了“灵性”。他说，两大神经网络让它照顾到了大势和局面，蒙特卡洛算法又让他像人一样，在现有的棋面下，再往深处想几步。

　　“直觉”也是围棋魅力的一部分，当棋局达到一定深度的时候，靠的只能是直觉。据统计，围棋棋步的数量甚至要远高于宇宙的原子总数，围棋的步数有10的360次方之多，而宇宙的原子数则只有10的80次方。

　　“如果你问一个围棋大师为什么这一步要这么走，有时候他只能告诉你，这样走感觉是对的。围棋更像是一个靠直觉的游戏。”哈萨比斯在此前的宣传短片里这样说，这也是围棋程序让很多科学家着迷的原因所在。因为再强大的数据库也无法完全覆盖围棋所有棋路，要想将围棋程序训练成绝世高手，只能赋予它“直觉”。

　　黄士杰在日前也曾表示，是人类的“直觉”给了他们启发，AlphaGo观察围棋的整体布局，然后选择最佳下法，这种方式就像依靠直觉和第六感作出判断的人类大脑的功能。

　　田渊栋将这种“直觉”说成是“可以学到的模型”。据他介绍，从一开始的规则驱动的暴力搜索，到特征驱动的线性模型，再到数据驱动的深度学习，越来越强的模式识别能力让“直觉”两字从神秘莫测，变成了通过大量样本就能学到的模型。

　　现在常见的语音识别、图像识别技术，就被很多人认为是机器“直觉”的一部分。

　　TA还没意志和情绪

　　哈萨比斯曾在多个场合表达过自己的想法——设计一款世界级的围棋冠军并非最终目的，他要做的是编写一款通用领域的人工智能程序。

　　这被很多人认为是在吹嘘，魏斯在接受记者采访时就表示，短时间内很难实现，但是AlphaGo独特的编程依然还是让不少人看到了它的不同之处。

　　《Nature》高级编辑坦吉·肖尔德在此前接受媒体采访时就直言：“‘深蓝’是单一程序，只针对国际象棋，且需要科学家手工操作。而AlphaGo中包含的神经网络程序，可以通过抓取信息实现学习技能，不需要再进行领域特定编程。”

　　田渊栋在对DeepMind团队发表在《Nature》上的论文分析之后得出结论，与之前的围棋系统相比，AlphaGo确实没有依赖围棋领域的知识。

　　然而，人工智能从专一领域到通用领域的跃进，中间隔着的是个不小的坎。田渊栋就悲观地表示：“如何让机器学会人类的各项能力，依旧是一座需要攀登很多年的大山。”

　　魏斯则认为，此次人机大战的象征意义大于技术突破，深层次的语义理解、感知、推理等方面的能力，现在依然比较弱。“很少有机器能分清楚‘中国足球很烂，谁也赢不了’和‘中国乒乓球很好，谁也赢不了’两句中‘谁也赢不了’的意思。”

　　翟振明将人工智能分为“强人工智能”和“弱人工智能”。目前这种没有情绪、没有意志的人工智能属于“弱人工智能”。在他看来，按照现在思路来搞人工智能，做出来的人工智能不可能有自我意识和情感意志。几十年前他就开始研究，现在可以说已否定了图灵测试与人的自我意识的涌现的实质性关联。他把“强人工智能” 的希望寄托在量子力学的研究之上，他说按照量子力学的基本构架可能会有实质性突破。

　　据了解，最近美国量子物理学家斯塔普、英国物理学家彭罗斯都提出了人类意识的量子假设，中国清华大学副校长施一公院士、中科大副校长潘建伟院士等也大胆猜测，人工智能的底层机理就是量子效应。

　　延伸：DeepMind已公开研发过程

　　AlphaGo在此次人机大战中已经展示了自己超强的学习能力，虽然尚未与柯洁交手，但是在很多人看来，未来战胜柯洁或许仅是时间问题。柯洁与DeepMind的隔空喊话，是否能变成场上对弈，也充满了悬念。

　　人机大战的象征意义已经产生，再争世界第一除了商业价值之外，再无其他意义。第一还是第二，对于AlphaGo和DeepMind团队来说，意义并不大。就像没有哪一位围棋选手可以一直霸占世界第一的位子一样。

　　此外，值得注意的是，据黄士杰介绍，DeepMind团队已经把所有开发过程与论文内容在网上公开，这也意味着复制AlphaGo的技术并不会是一个多么大的难题，只要那些研发团队愿意，在未来就可以有更多AlphaGo的出现。

　　“目前的人工智能只能是人类的工具，但是并不排除有朝一日，以量子力学为基础设计出来的计算机会生产出具有第一意识‘我’的人工智能，只不过那时的人工智能，就不再是工具，而是我们的同类，我们的后代。”翟振明教授如是说，“当然我们也不必以敌对的心态马上想到的就是被‘征服’被‘消灭’之类的‘末日’残局”。

　　-

　　作者：越南人

　　

　　· 推荐这篇文章仅因为：文末提到量子计算机 -- 越南人 -



	Copyright ◎ 2006-2010 东洋镜工作室 All Rights Reserved