在世界人工智能科学诞辰60周年、谷歌公司的阿尔法围棋(AlphaGO)软件与世界围棋冠军李世石上演了“世纪人机大战”之际,中国人工智能学会机器博弈专业委员会组织了专题研讨活动。专委会的徐心和教授、刘知青教授、贾云得教授、张小川教授、武坤教授、吴立成教授、李淑琴教授、王亚杰教授应邀参加了研讨,他们都是多年从事计算机博弈研究的专家,各位专家主要针对AlphaGO软件的技术内容、人机大战的意义、计算机博弈未来的发展等方面开展了讨论,发表了关于一些问题的看法,相信此次研讨必将促进计算机博弈技术在我国的进一步发展,现总结如下。


一、阿尔法围棋的主要技术特点是什么?


刘知青教授(中国人工智能学会理事、机器博弈专业委员会副主任、北京邮电大学计算机围棋研究所所长): 


围棋对于国际人工智能领域来说是公认的重大挑战,因为围棋涉及了形象思维、逻辑判断、优化选择等复杂的重大的人类智能。国际学术界原来认为需要十年到二十年才能彻底解决人机对弈的问题。这次阿尔法围棋的出现,大大缩短了大家对人工智能的预期。过去10年,计算机围棋一直使用一种新的技术叫“蒙特卡洛树搜索”,蒙特卡洛树搜索底层有一个坚实的数学基础,上层使用并行计算,通过计算、模拟、采样、优化等一系列的数学方法,使计算机围棋技术有了明显的提高。


蒙特卡洛树搜索也是阿尔法围棋的一个基础技术点,除此之外,就是基于机器学习的神经网络,神经网络有很大的作用:第一是通过学习高水平棋手的棋谱,获得如何在盘面落子的一种棋感;第二是通过机器的增强型学习,获得形势判断的棋感。这两个棋感通过蒙特卡洛树搜索的技术进行验证,使阿尔法围棋实现了技术突破。


阿尔法围棋最让人震惊之处还在于它拥有强大的学习能力,它的学习过程体现在两个方面:一个是人为的,工程师给它输入了几十万盘棋谱,它在应对不同棋局的时候知道怎么落子;第二个就是自我的学习,它平时自己跟自己下棋,中间有胜有负,于是它对于胜负有了感觉。阿尔法围棋的这种学习过程是人类科技的突破点。


计算机的优势在于可以不受情绪的干扰,没有人的压力,它可以理性地、仔细地计算每一步。在这次人机大战中,计算机展现出来的应对水平还是非常强大的,而且显现出前所未见的优势,有助于大家真正认识计算机围棋、人工智能的重要性,同时也给人工智能的发展提供了非常好的机遇。随着技术的发展,我们有了大数据、廉价的并行计算、深度的机器学习方法,这些都推动了人工智能的发展。


二、深度学习的主要技术内容有哪些?


吴立成教授(中国人工智能学会机器博弈专业委员会委员、中国人工智能学会认知系统与信息处理专业委员会委员、中国自动化学会智能自动化专业委员会委员、中央民族大学信息工程学院副院长):


深度学习是基于多层网络结构的一种机器学习方法,它逐层提取抽象特征,通过多层非线性传输,完成复杂的目标函数系统逼近。深度学习在手写体数字识别、机器视觉、自然语言处理、语音识别、数据降维、文本处理等方面的应用都取得了成功。


深度学习领域典型的网络模型包括卷积神经网络(Convolutional Neural Networks,CNN)、深层玻尔兹曼机(Deep Boltzmann Machine,DBM)和堆叠自动编码器(Stacked Auto-Encoder,SAE)等。


CNN是一种较为实用的深层神经网络的基本模型,该模型依靠卷积(Convolution)和池化(Pooling)运算搭建。在CNN中,上一层的输出与某个卷积核(Filter)进行卷积运算,作为下一层的输入。CNN可以大大减少优化的参数个数,同时还具有一定的平移不变性。CNN不需要很多参数,是一种容易训练的模型。一般而言,只要网络结构合理,卷积神经网络是不需要预训练的,甚至随机的权值就可以得到较好的结果。


DBM是两阶段训练模型,第一个阶段是无监督的预训练,第二阶段是有监督的训练。DBM网络的每一层看作一个受限玻尔兹曼机,进行无监督的预训练,以得到每一层的权值。整个DBM训练结束之后,再采用BP算法进行有监督训练,对权值进行微调,最终得到一个深层结构的神经网络。


SAE的训练过程和DBM一样使用贪心逐层预训练算法,但因为是通过重构误差来进行训练,相比较而言比训练DBM容易,所以常常用来代替DBM构建深度结构。通过将DBM中的受限玻尔兹曼机替换成自动编码器,形成SAE。SAE的特点就是它与DBM一样也是一个生成模型,但是数据样本在作为SAE的输入的同时还能够作为SAE的输出目标,从而检测SAE中间层学到的特征是否符合要求,通过逐个自动编码器的训练,最终完成对整个网络进行训练。


深度网络学习往往需要海量数据,计算量非常大。因此,设计降低计算复杂性的学习方法,具有重要意义。在设计有效的学习方法时,由于对训练过程的速度及准确率有影响,网络权重的初值、先验知识、网络局部极小值、网络过学习等也是需要充分考虑的因素。


总之,设计合理的深层网络结构及有效的学习方法,是深度学习的主要技术内容。


三、机器智能将超越人类智能吗?


贾云得教授(中国人工智能学会机器博弈专业委员会副主任、北京理工大学计算机学院智能信息技术北京市重点实验室主任):


大多数学者用人工智能术语表示赋予计算机类人的智能,我愿意用机器智能这一术语。机器智能不仅包含人工智能,也包含机器通过自主学习、复制、发育与进化获得的智能。AlphaGo的成功再一次诠释了机器智能超越人类智能的趋势不可阻挡。AlphaGo的重要性不仅仅是打败围棋世界冠军,更是已有技术集成之威力的冰山一角。随着科学技术的迅猛发展,将会不断出现更强大的机器智能系统。


AlphaGo的惊人之处是他能够通过海量数据学习和自我强化学习这两种普通计算策略,在强大的计算资源支持下学到了超越世界冠军的本领,完全超越了人们普遍认为其只会高速“暴力”计算这样的传统概念,就连中国围棋队总教练俞斌九段直言,AlphaGO电脑在棋的“境界”方面已经超过了人类。预计在不久的将来,会有更多的智力竞技项目被机器智能摘冠。


实际上,机器智能已经在分析、归纳、推理和感知方面的许多分支领域超越了人类,其形态也是多样化的(不仅仅是软件或机器人)。现在出现了许多优秀的智能系统,这些系统就在我们身边,包括街景识别、信息搜索、机器翻译、无人驾驶等。机器智能发展可分为初级、中级和高级阶段。初级机器智能的主要特征是依赖人或人机协同控制,中级机器智能的特征是独立与自主,高级机器智能的特征是自我复制与发育进化。毋庸置疑,现有的机器智能仍处于初级阶段,该阶段始于20世纪50年代初期的计算机跳棋程序。初级机器智能需要100年的发展历程,即2050年前后进入中级机器智能阶段,计算机技术和计算机形态的高速发展和演化会加速这一进程。中级机器智能的自主性,将产生机器情感和机器意识,也许他们的“情感”和“意识”产生机制完全不同于人类,但可以学习并表达出对付人类情感和意识的行为。中级机器智能具有学会讨好和帮助人类的能力和意识,但机器智能全心全意解决人类各种问题并充当人类好助手的同时,免不了要加入到人类的竞争活动中,体验并加剧竞争的残酷性。如果竞争变成了战争,则机器智能扮演的角色不言而喻。


另外,机器智能出众的才能也会被用来指挥和领导人类成员完成某一任务,会出现机器培训、奖罚人类成员等涉及社会伦理的问题。如何防止乱用机器智能,是我们社会面临的一个难题。殊不知,有许多科研团队正在研究机器情感、机器意识等,也有科学家在研究机器创造力、机器发育、机器进化等。如果无人干预,任其发展,则2100年前后出现高级机器智能。高级机器智能可以控制原先由人类控制的大部分资源和人力,高级机器智能可以无处不在,完全可以打破人类的束缚进行大量自我复制和发育进化,其后果是难以想象的。因此,我们在抱怨机器智能带来社会文明进步的同时,也要制定相应的禁令,如同对待克隆技术的态度。上述赘言也是对霍金、盖茨以及许多人工智能专家提出“警惕人工智能”善意警告的解释吧。


四、这场人机大战对围棋发展起到什么作用?


武坤教授(中国人工智能学会机器博弈专业委员会委员、中南大学信息中心主任):


AlphaGo与李世石九段之间的终极挑战,表明围棋的后人工智能时代已经不可避免的来临。之后会有5年左右的人类棋手与后人工智能的一个共同进步的阶段,该阶段大约持续3至5年。1997年,IBM的计算机“深蓝“第一次击败了国际象棋大师卡斯帕罗夫;2006年,人类最后一次打败顶尖的国际象棋AI,因此国际象棋也经历了人工智能与棋手共同发展的一个阶段。


我们不用关心强人工智能能否在某些领域打败人类,因为强人工智能本身就是人类方方面面的智能的总和,因此总和战胜局部是必然的。我们所更关心的应该是,当围棋人工智能与人类职业棋手进入同步成长的阶段,我们有哪些工作可做?


第一,挖掘、传承和发扬围棋文化。围棋不仅是一种复杂的、有趣的竞技运动,而且是一种高级的思维活动,它广阔、深邃的内涵,已经构成一个独特的文化形态,可以称之为围棋文化。围棋辩证法是统帅棋理、技艺的最一般的方法,这正是围棋文化哲学理想的核心和灵魂。围棋心理学也日益引起人们的关注。


第二,应用围棋进行启蒙教育。围棋的教育功能使它能对人的心理素质产生积极的影响,主要体现在智力、人格、心理健康等方面。产生这些结果的原因是围棋对人脑功能的开发具有良好效果。


第三,注重围棋理论的研究。任何学科都有其应用技术部分,只注意应用技术而忽视基础理论,这一门学科纵然一时能够获得很大的发展,最终将难免受到限制。围棋也不例外,因此我们要挖掘并研究它。


五、人工智能会对人类造成威胁吗?


张小川教授(中国人工智能学会理事、机器博弈专业委员会副主任、重庆市人工智能学会常务理事,中国人工智能学会会刊《智能技术学报》(英文版)副主编,重庆理工大学软件工程系主任、兼人工智能系统研究所所长、机器人与智能制造重庆市高校重点实验室副主任):


在人工智能发展历程中,每当重大事件发生时,如IBM“深蓝”打败卡斯帕罗夫,谷歌“阿尔法狗”打败李世石等,人们都会产生“人工智能会威胁人类、会毁灭人类”等类似问题。2015年底,SpaceX公司联合创始人马斯克警告说:“人工智能会统治世界”。此话立刻在全球引发对人工智能的激烈争论。此前,比尔•盖茨也表达过类似担忧。对这样一个重大问题,它是否会发生,或以何种形式发生,各方分歧巨大,因为其中涉及的不仅有技术问题,还有伦理、哲学等问题。但是,我坚持认为人类不能因为存在“威胁”就拒绝人工智能,就如不能因为原子弹就拒绝原子能一样,事务都有两面性,人工智能也如此。


首先,对特定场景下的特定任务,人工智能超越人类,这已经一再被证明,也将会继续被证明。本质上看,人工智能及其“智装”的系统,仍是一个工具,从人类发展史看,人类制造的工具在一些特定方面都会超过人类,如飞机的“飞”、斧头的“劈”、枪弹的“击”等等,无不如此。因此,即使现在人工智能拥有了学习新技能,甚至今后可能拥有的自主意识能力,但这些都不能否认人工智能作为技术工具的本质属性。


其次,工具无“好”与“坏”。利刃可以防身、提高劳动效率,但也可被坏人当作犯罪工具。其好与坏并不是工具所固有的属性,好与坏是使用这个工具的人赋予或强加上的。因此,不能因为工具可能被坏人利用,产生威胁、风险,就拒绝研究、发明、使用先进的工具。正确的做法应该是积极管控好人类自身行为,如制定机器人技术三原则之类的行动准则,当然,除道德约束外,最好还应有法律法规上的约束。


再次,人工智能全面超越人类智能为时尚早。2016年3月发生的两件事情,也间接说明这点。23日,在Twitter上线的微软机器人Tay,不到24小时,被人类“教坏”,变成一个性别歧视、种族歧视、满嘴脏话的“不良少女”,逼得微软不得不让她“下岗”。据微软介绍,Tay被设定为十几岁的少女,目标受众是18岁至24岁的青少年,能在与人交流中不断学习,随着时间积累,她的理解能力将逐步提升,将变得愈发“智能”,可事实呢、结果呢?15日,阿尔法狗最终以4:1大比分战胜李世石九段,但在目前它也仅能证明在围棋这个高度标准化的博弈场景、数学意义的组合优化决策问题中,打败了人类。除了所擅长领域外,在面对复杂环境或不能结构化的问题时,机器人很可能就变得无知、甚至是愚昧的。


作为人工智能工作者,我们仍然应一如既往地努力工作,应该也必须立足于服务人类、造福人类,推动人工智能的健康发展,并主动避免将其用到研制威胁人类的工具,这不仅是人工智能学者、专家的事情,也是全社会的责任和义务。


六、中国的人机大战情况如何?


徐心和教授(东北大学信息学院博士生导师。曾任国际机器博弈协会副主席、中国人工智能学会常务理事、机器博弈专业委员会主任):


计算机博弈在中国起步较晚,2006年才组织首届全国锦标赛,当时仅有一个项目——中国象棋,只有18支代表队参赛,但是起点很高,还有来自美国、法国、台湾的多支在国际大赛获奖的代表队。这届锦标赛的前五名,挑战五名中国象棋的特级大师和大师,这在中国是首次人机大战。参赛的五位象棋高手是柳大华、卜凤波、徐天红、张强和汪洋。这次大赛是在浪潮集团支持下进行的,时间:2006年8月9日;地点:北京奥体中心。中央电视台和国内各大媒体都给予了高度重视,因此影响很大。由于限制各方时间包干45分钟,计算机占有优势,最后以11:9的微弱优势获胜。


为了替大师们“报仇”,也为了找回人类的尊严,8月15日,素有“象棋第一人”之称的全国排名第一的国际特级大师许银川与锦标赛冠军棋天大圣+浪潮天梭服务器在北京香格里拉饭店进行了一场人机大战终极PK。应大师的请求,本次比赛采用每方基本用时45分钟,每步加时30秒赛制,并且两盘比赛分别安排在了上下午,以给大师更加充分的思考和休息时间。这可真是一场巅峰对决,双方势均力敌,经过一天的鏖战,两盘均以和棋告终。许银川在赛后的新闻发布会上表示:“能下成两和,是我意料之中的事情。一年之中有那么多比赛,这场对决,是我职业生涯中难忘的一幕”;“浪潮天梭(棋天大圣)在本场比赛中表现的水平,可与大师相媲美,整场比赛很艰苦,但计算机的思维带给我非常大的开拓性启示。”在被问及对此次比赛最深的感受时,许银川答道:“可以用暗朝汹涌,惊心动魄来概括。与计算机下棋真的很累,因为我在明处,它在暗处,不知道它想的是什么。”


2011年在中国人工智能学会主办的中国首届智能博览会上,机器博弈专业委员会组织了一场“棋类人机大战”。9 月16 日上午9 时30 分,人机大战拉开帷幕,首先进行的是九路围棋。计算机方面是当年的锦标赛冠军——北京邮电大学计算机围棋研究所本手队(Lingo),对手则是国家围棋队总教练俞斌九段。根据预先商定,俞斌让2 子,执白。中国棋院围棋代表队王元八段、华学明七段现场讲盘。数十名人工智能领域的专家和围棋爱好者关注此次人机大战。中央电视台体育频道、新闻频道、新华社、体育报、新浪等多家媒体进行了现场报道。经过紧张对决,最后北京邮电大学本手队2 盘棋均胜俞斌,而且进行讲盘的华学明七段对第2 盘棋计算机的发挥赞不绝口,称之为“完胜俞斌”。这场比赛虽然在九路围棋上显示了计算机程序的进步,但就围棋而言(19路),其水平仍然不及一般的业余选手。


紧接着,机器博弈专业委员会还组织了中国象棋的人机大战,最有代表性的是计算机锦标赛冠军象棋名手队挑战特级大师赵鑫鑫(浙江台州人,1988 年出生,多次获全国少年赛冠军,2007年获得全国个人赛冠军,2009 年获得世界锦标赛冠军,也是中国最年轻的世界冠军和个人赛冠军),经过一个半小时的对阵,双方握手言和。由此不难看出,中国象棋的计算机水平绝对可以和国内外的顶级高手进行较量。


七、为什么这场人机大战产生如此巨大的影响?


李淑琴教授(中国人工智能学会机器博弈专业委员会委员,北京信息科技大学“感知与计算智能联合实验室”主任,北京信息科技大学计算机学院教授):


这场人机大战是电脑向人类顶尖智慧发起的挑战,是人工智能近年来取得巨大进步的缩影,AlphaGo意味着一种质变,所带给我们的是在人与机器人关系的思维方式和深度上的变化。


信息技术的发展标志着第四次产业革命的到来,计算机技术革新是信息技术飞速发展的重要前提和基础,计算机技术的智能化也已广泛应用于各个领域,从而带来电脑辅助人脑,进而代替人脑的话题,也成为科幻文学中最喜好的素材。1997年,IBM研发的电脑“深蓝”战胜国际象棋大师,电脑第一次完胜人脑,当时已经引起人们的惊叹。然而人们还存有一定的侥幸,认为电脑不可能或至少在短时期内不可能战胜人类发明的最复杂的智慧竞技项目--围棋。因为国际象棋平均每回合只有35种选择,围棋每个回合则有250种可能,250种可能中每一种又有250种可能,其运算结果是一个天文数字,玩好它需要具备形象思维、逻辑判断、优化选择等高智能能力,为此人们一直把围棋看成是人类智力对抗电脑的“最后堡垒”。因此,人们对这场比赛的关注已上升到人工智能能否战胜人类智慧的高度,议论的重点已经从个人的胜负,提升到机器未来是否会统治世界。因为人类的许多发明创造在给我们的世界带来活力的时候,也给我们的世界带来了一些灾难。技术是中性的,人发明了机器人,不等于可以永远控制它,我们还无法预见具有自我学习能力、自我复制能力、具有情感的机器人将来会主动性的做出什么事情,将来人和机器人将如何共处和共融呢?


人工智能在过去5年加速发展,特别是在深度学习领域,AlphaGo的胜出充分证明了深度学习技术的潜力,也表明机器在逻辑推理计算方面的能力有可能超越人类。AlphaGo的出现,影响的不仅仅是围棋,它作为“通用大脑”,在预测、分析、推荐等方面,会产生巨大商业和用户价值。目前从谷歌量子计算机到写稿机器人,从无人机到无人驾驶汽车,再到虚拟现实,人工智能已经渗透各个领域,或许终有一天,重复性、辅助性、技术性的人类劳动将被机器所替代。AlphaGo代表了一种不断超越自我、拓展前沿科技的雄心。人类智力的发展终究是有限的,而作为人类智力成果的科学技术的发展却是永无止境的。相对于科学技术发展的未来,人类其实还很渺小,还有太多的未知领域需要探索,因而我们要如何保持足够的敬畏和强烈的求知欲呢?


人工智能作为基础科学,无需质疑是目前科技界最热门的领域,也已成为资本的宠儿。不论是谷歌、Facebook、微软、IBM等国际巨头,还是国内百度、腾讯、阿里等代表的科技力量,均将人工智能技术作为未来发展的重点,谁都想抢占科技和商业的制高点,甚至欧美发达国家也都在致力研究人工智能计划,如欧盟“人脑工程项目”、美国“大脑研究计划”等,谁能赢的了人工智能,谁就赢得未来!未来十年是人工智能发展的关键时间,如何确保我国在未来10年的人工智能最关键技术发展时期,具备与国际抗衡的研发实力和研发进展,确保我国在科技进步浪潮中跟上并处于国际领先地位,值得大家关注与深思。


八、中国的计算机博弈发展形势如何?


王亚杰教授(中国人工智能学会常务理事、机器博弈专业委员会主任,沈阳航空航天大学工程训练中心副主任):


2005年由东北大学徐心教授组织申请、中国人工智能学会批准成立了机器博弈专业委员会,吸引了一批国内的科技工作者加入机器博弈领域的研究。专委会每年组织一次学术活动,在CCDC国际会议上申请了“计算机博弈特邀专题”,开展成果交流,提高我国计算机博弈的学术水平。


专委会每年还组织一次全国性的计算机博弈竞赛,博弈项目通过将计算机技术和人工智能技术相结合,巧妙地引导青年学生提前接触、理解智能科学与技术,将所学的理论知识与实际领域技术相结合,较好地激发了大学生的创新潜能,培养了大学生的科研思维与团队合作精神。通过竞赛使国内的计算机博弈水平不断提升,一些棋种的冠军得主每年在更替,促进了计算机博弈技术在我国的普及与发展。


全国计算机博弈比赛经历了三个发展阶段:


第一阶段:2006~2010年,全国计算机博弈锦标赛阶段,由中国人工智能学会主办。这是比赛发展的初期,参加的学校和队数相对减少。


第二阶段:2011~2014年,全国大学生计算机博弈大赛暨全国计算机博弈锦标赛阶段,由中国人工智能学会和教育部高等学校计算机类专业教学指导委员会共同主办。在这一阶段,徐心和教授带领机器博弈专委会做了大量的宣传工作,先后去了100多所院校讲学,所设置的项目数、参赛队数和参加的学校数都明显增多。


第三阶段:2015~现在,2015的比赛正式成为国家级别的科技竞赛活动,由国家体育总局棋牌运动管理中心、中国人工智能学会和教育部高等学校计算机类专业教学指导委员会共同主办,并被国家体育总局纳入第三届全国智力运动会项目,计算机博弈竞赛与棋牌运动可以良性互动,即可以激发大学生创新潜能,又能有力促进棋牌运动的快速发展。这是中国计算机博弈发展史上的一个新的里程碑,是更有意义、更有影响的一次赛会。


2015年的比赛共设置了17个项目,大学生项目包括:五子棋、六子棋、点格棋、苏拉卡尔塔棋、亚马逊棋、幻影围棋、不围棋、爱恩斯坦棋、军棋9种棋类;锦标赛项目包括:中国象棋、围棋、13路围棋、9路围棋、国际跳棋(100格)、国际跳棋(64格)、二打一扑克牌(斗地主)和桥牌8种棋牌类。据统计,2015年在中国棋院开展的博弈比赛,共有来自国内35所高校的220支代表队参加,在各校选拔赛和国赛中,累计参加人数达5000左右。


总之,经过10年的发展,从无到有,从小到大,中国已经是世界上计算机博弈发展的大国,但还不是强国,还需要不懈的努力。我们要做好宣传和普及工作,让计算机博弈在更多的学校中生根、开花和结果,我们还要走出去,在国际大赛中取得更好的成绩。


中国人工智能学会机器博弈专业委员会

2016年3月28日

中国人工智能学会
2016年04月12日


Copyright © 2010 中国人工智能学会 互联网ICP备案:京ICP备06029423号-1
地址: 北京市海淀区西土城路10号 邮编: 100876 技术支持: 010-62283919

二维码