眼遇 设为首页 登陆

抚州准分子屈光近视手术,抚州准分子手术,抚州准分子屈光手术

2017-12-11 08:20:20 来源:葫芦岛晚报

抚州准分子屈光近视手术,

人工智能论坛哈萨比斯演讲

  5月24日,人工智能高峰论坛在浙江桐乡举行。AlphaGo团队向大家分享技术细节。

  大卫席尔瓦:介绍AlphaGo算法。

  为什么选择围棋?它是人类最古老、研究最深入的游戏;是构建理解运算的最佳试验台;人工智能面临巨大挑战:游戏大至可以进行穷举搜索。

  我们利用卷积神经网络来实现,原版AlphaGo有12层,Master有40层。我们用策略网络和价值网络来解决问题,策略网络进行落子选点,价值网络进行评估。通过人类棋谱来进行监督式学习,调整参数来达到理想效果,通过策略网络来进行强化学习,自我对局成千上万盘,通过价值网络来评估,预测每一步棋后终局的输赢。

  如果用穷举搜索,范围实在太大,我们需要简化减少搜索量,通过策略网络来聚焦几个有可能的选项,用价值网络来降低搜索深度。就是AlphaGo的树搜索,从树根开始,一个搜索基础上加上一个新搜索,最终把结果提交给树顶。这个过程会重复成百上千次,直到发现哪一步赢棋概率最高。AlphaGo Lee在谷歌云上有50 TPUs在运作,搜索50个棋步为10000个位置/秒,于2016年在首尔大败李世石。

  AlphaGo并不是比深蓝更聪明,而是用价值策略网络减少了搜索范围。AlphaGo Master版本更强大,在单个TPU机器上进行游戏,相当于AlphaGo成为自己的老师,从自己的搜索里学习,使用最好的来自AlphaGo自己的数据;更强大的策略/价值网络。TPU在谷歌云上可供大家使用。

  未来能看到人机结合的巨大力量,1+1>2,在AI支持下人类能变得更加强大,有点像哈勃望远镜探索宇宙,人工智能让我们更好了解世界,为人类所用的好工具,在科学、医学等领域帮助人类进步。我们寻求最优,探寻距离最优还有多远,怎样才是完美的棋局;3000年对弈都不足以找到最佳棋局;AlphaGo让我们可以探寻这些有趣奥秘;无数其他领域也将遭遇“组合轰炸”;强人工智能是我们研究和探寻宇宙的终极工具。

  在科学研究、新药研制等领域,不仅在玩游戏,也要在现实生活中应用,在数据中心优化方面,我们能节省谷歌中心40%电能。元解决方案:信息过载和系统冗杂是巨大挑战;开发人工智能技术可能是这些问题的元解决方案;目标:实现“人工智能科学家”或“人工智能辅助科学”;和所有强大的新技术一样,在伦理和责任约束中造福人类。我对自己大脑也非常感兴趣,包括如何运作、做梦等等,希望人工智能帮助我们更好了解自己。

  哈萨比斯:李世石表示人机大战给了围棋新启发,这令人欢欣鼓舞。关于直觉,就是通过体验直接获得初步感知,但无法言传、表达出来,可通过行为确认其存在和正误。而创造力是通过组合已有知识产生新颖独特想法的能力,AlphaGo显然已在围棋上展现出了创造力。我们希望打造完美的AlphaGo。在首尔的比赛显示AlphaGo还有不足,我们希望弥补他的空白,在网上以Master的名字来做测试,获得60比0的佳绩,棋手们获得很多启发。展现出很多新招法,比如点三三、序盘连续爬二路,等等。柯洁表示人与AI应携手并进,古力也表示人与AI合作的时代大幕已拉开。卡斯帕罗夫也在书中说,深蓝已结束,而AlphaGo才刚开始。AlphaGo有点像吴清源在三四十年代一样带来围棋新时代。棋类程序讲战术,而AlphaGo讲战略。

哈萨比斯回顾去年与李世石的比赛
哈萨比斯回顾去年与李世石的比赛

  戴密斯哈萨比斯:今天我将介绍如何赋予机器创造力,以及DeepMind在做什么。DeepMind2010年创立于伦敦,2014年加入Google,目前进行人工智能“阿波罗计划”,发现研发科学新方式。我们第一步是要攻克智能。打造通用型学习机器,非程序预设——自主学习原始材料;通用:同一系统可执行多种任务。用原先的经验应对新挑战。核心技术是深度学习和强化学习。

  通用型的强人工智能与弱人工智能不一样。最好的例子就是深蓝击败卡斯帕罗夫,智能之处是用既定代码输入深蓝,还不算强化学习。

  强化学习框架:智能体通过观察建模来了解环境,从而做决定计划行动,应对挑战,强人工智能就能实现,从而帮助到人。

  雅达利智能体:包括百余款八十年代的八位雅达利游戏。通过深度强化学习,在进行300次游戏后发现捷径明显变得更加善于游戏,获得更好策略,这是三年前的情况。

  这两年AlphaGo团队专注于围棋项目,因围棋复杂程度让穷举搜索都难以解决:“不可能”写出评估程度已决定谁赢;搜索空间太过庞大。

  围棋与国际象棋相比,不光是简单计算,更需要直觉。比如问国象棋手,他会说自己有明确的逐步计划。而围棋手可能不仅靠计算,而是靠直觉;围棋中没有等级概念,所有棋子都一样;棋盘是空的,要在心中不断摸索预测未来,围棋是建筑游戏,因此需要盘算未来;小小一子可撼全局,牵一发而动全身;“妙手”如受天启,玄妙深奥,好像天赋灵感。

  如何才能化繁为简,是通过两种网络来实现:策略和估值网络。我们在《自然》杂志发表论文,很多公司也随之作出了很不错的人工智能围棋程序。去年AlphaGo与李世石的人机大战令韩国万人空巷,AlphaGo最终获胜,这一刻等了十年,可以说是十年磨一剑。在第二局中,AlphaGo第37步棋是我最喜欢的,让世人惊叹,他走出五路尖冲,是让人难以想象的。如果在三路是重视实地,在第四路下棋更重视中央,而在第五路下棋则很少,似乎有些落空的感觉,自古人类都低估了在五路下棋的价值。而AlphaGo左下早早的两颗黑子在50步后发挥出了作用。而李世石在第四局走出的那一手也显示出他的天才,那次人机大战有2.8亿观众、3.5万篇报道、棋盘销量增长10倍。

  上台前的哈萨比斯,今天他会和大家分享些什么呢?

参加论坛的樊麾和黄博士
参加论坛的樊麾和黄博士

编辑:何小千

相关新闻