下一代alphago,裸体测试也能拿到满分
由谷歌母公司Alphabet拥有的DeepMind本月已经采取了很多举措。
首先,本月初,蛋白质结构预测AI--AI--AlphaFold 2赢得了CASP竞赛的冠军,解决了困扰学术界50年的问题:生物学家AndreiLupas自己花了十年时间用各种实验方法找出蛋白质的折叠形状,但在AlphaFold 2的帮助下,他在半小时内就得到了答案。
然后,月底,DeepMind在"自然"杂志上发表了一篇论文,介绍了AlphaGo,MuZero的高级版本。简单地说,MuZero更"通用"。它精通国际象棋、围棋、普通象棋,在数十款Atari游戏中完全超越了以往的人工智能算法和人类。但更具有革命性的是,木零不像它的祖先,在下棋和玩游戏之前根本不知道游戏规则,而是通过自己的实验和摸索形成自己的决定,洞察国际象棋和游戏规则。换句话说,AI将"使用他自己的头脑"。
MuZero就像Netflix热剧"皇后的国际象棋"(The Queen‘s Chess)中的贝丝·哈蒙(Bess Harmon)。他一点也不知道国际象棋的规则,他用几个观察结果"画出"棋盘",不断回顾国际象棋比赛,增强了她的直觉,最终变得无敌。
我不知道规则,我怎么赢国际象棋?
AlphaGo出生于2016年,在2017年乌镇围棋峰会上击败了韩国顶级国际象棋选手李石(Lee Shik)和世界上第一位国际象棋选手克杰(音译)。中国围棋协会(China Go Association)甚至立即授予了AlphaGo职业围棋(AlphaGo)九段的称号。
AlphaGo依赖于DeepMind输入的专家象棋数据集,然后它的继任者AlphaGoZero开始摆脱对"人类数据"的依赖,并开始通过多种自我游戏积累所需的数据。2018年年底发布的AlphaZero在前两个版本上进行了迭代。除此之外,它还学会了下棋和下棋。令人惊讶的是,AlphaZero只用了24小时就能看到棋盘,成为世界级的国际象棋大师。
但你不能就像下棋那样向前看。你必须学会这个世界是如何运作的。DeepMind的首席研究科学家戴维-西尔弗告诉"连线"记者,他们决定不告诉AI如何提前获胜。"这是我们第一次建立这个系统。
上面提到的"Alpha"家族首先需要"人工数据"、"领域知识"和"游戏规则",或者至少依赖于"游戏规则"。另一方面,MuZero没有这种知识储备,就像下棋是蒙着眼睛玩游戏一样。