当前位置:首页 > 网络安全 > 正文内容

DeepMind为AI打造出一个「元宇宙」,XLand到底有多牛?

访客3年前 (2021-09-25)网络安全442

  

  文丨锌财经,作者丨陈伊婷,编辑丨大风

  DeepMind推出最新泛用型游戏XLand,冷不丁丢出一个重磅炸弹。这意味着,在零样本且不需要事先知道规则的情况下,就可以打造出一个全新的、堪比AlphaGo的人工智能。

  一直以来,AI强化学习苦于泛化能力差,只能针对单个任务来从头开始学习。

  5年前,AlphaGo打败世界围棋冠军李世石,举世惊呼。自AlphaGo之后,Deepmind又推出能通学西洋棋、将棋、围棋的AlphaZero。

  

  AlphaZero非常强大,在三大棋领域中「打遍天下无敌手」。但问题在于,AlphaZero若想能够在不同游戏中「称霸天下」,还得在每个游戏「从零训练」后才能够实现。

  XLand的出现则弥补了这个缺陷。如果说AlphaZero是「下棋的手」,那么XLand则创造出了「一个人」。

  它的强大之处,在于它高度泛化的能力。简单的说就是触类旁通,好比人类学会用筷子夹米饭,就能学会用筷子夹菜。而DeepMind打造XLand的目的,则是为了让自家通过强化学习训练的AI,能够玩遍「全宇宙的游戏」。

  这个世界的任务由游戏、世界、玩家构成。根据三要素的不同关系,来决定任务的复杂度。复杂度则由竞争性,平衡性,可选项,探索难度这4个维度评判。

  从简单到复杂的游戏,AI智能体通过第一人称视角去感知游戏中环境,并且不断尝试、碰撞游戏规则,从中累积庞大数据来训练自己完成游戏目标。

  简单的比如「靠近紫色立方体」,复杂一点的比如「靠近紫色立方体或将黄色球体放在红色地板上」。长此以往,AI智能体从新手小白成长为屠龙勇士,吃鸡、捉迷藏都难不倒它们。

  

  基于此,一个由任务空间组成的、超大规模的「元宇宙」XLand就诞生了,几何地球只是其中的一个小角落。我们或许可以提出这样一个设想,人类是外星人创造的AI,而地球是外星人创造的XLand。

  经过5代训练,AI智能体在XLand的4000个独立世界中玩大约70万个独立游戏,涉及340万个独立任务的结果,最后一代的每个智能体都经历了2000亿次训练步骤。

  目前,AI智能体已经能够顺利参与几乎每个评估任务,除了少数连人类也无法完成的任务。

  从AlphaGo走到现在XLand,DeepMind展示了无监督式机器学习的高度潜力,也向世界证明未来训练AI的成本跟门槛将会越来越低,直至普及全球。

  未来的某一天,当AI也能够在「元宇宙」中自己学习演化,赛博朋克的世界是否会真的到来?

扫描二维码推送至手机访问。

版权声明:本文由黑客接单发布,如需转载请注明出处。

本文链接:https://therlest.com/72145.html

分享给朋友:

“DeepMind为AI打造出一个「元宇宙」,XLand到底有多牛?” 的相关文章

创业板投资风险揭示书,创业板风险揭示书

保荐机构(主承销商):中泰证券股份有限公司 苏州天路光科技股份有限公司(以下简称“天路科技”、“发行人”或“公司”)首次公开发行不超过2579万股普通股(a股)(以下简称“本次发行”)的申请,已经深圳证券交易所(以下简称“深交所”)创业板上市委员会委员审议通过,并经中国证券监督管理委员会(以下...

【紧急+重要】勒索病毒解决方案!附:MS17-010补丁下载

  滚动更新:2017年5月13日16:57:22   游侠安全网(良心网站,站长先贴上注意事项和解决方法!防止你看本文的时候就被加密了!   1、本次共计是自动化攻击,利用了Windows的MS17-010。但苹果的MacOS用户不用得意,因为在昨晚之前,我这里得到的好几起勒索攻击案例都是针对...

干洗对衣物有害吗

干洗对衣物有害吗 干洗剂实际上就是有机溶剂,所以对衣服多少都有点危害,只不过高级的干洗剂对衣服损伤小一些而已。 随着人们工作的繁忙和生活节奏的加快,现代人更多地把换下的衣物送到洗衣店干洗,以保证衣服不变形和有更多的时间休闲娱乐,这本是一件提高生活品质的好事,但据最新的研究显示,干洗衣物对身...

Webshell安全检测篇(1)-根据流量的检测方法

一、概述 笔者一直在重视webshell的安全剖析,最近就这段时刻的心得体会和咱们做个共享。 webshell一般有三种检测办法: 依据流量方法 依据agent方法(本质是直接剖析webshell文件) 依据日志剖析方法 Webshell的分类笔者总结如下: 前段时...

奥门币币对人民币换算 - 澳元兑换人民币汇率

在珠海拱北口岸地下商城,公布当日主要交易货币“美元、此外汇牌价汇率表仅供参考=6点0442则一元人民币换0,点04762元,很高兴为你解答。 1点2208澳门元数据对仅供参考,划算 另外,另外汇率是不断变化的,可以百度输入"澳门元对人民币汇率,货币兑换1澳元=4点。 在外面买东西的小店不是太正规的,...

纯钛多少钱一斤,钛合金回收多少钱一斤

1000/粗晶只要700/纯钛是银白色的金属,1点5钛板,钛合金它是α相固溶体组成的单相合金,行情非常低迷,TC4细晶也就。 金属钛回收价格随着钛的市场价变化而变化,楼上的价格是从哪儿来的。不同型号,各类价格如何?请高手相助!至于合金钛,不同地区价格也不一样,52000一吨遵义的海绵钛。 元-30元...

评论列表

馥妴雨安
2年前 (2022-09-02)

haGo的人工智能。  一直以来,AI强化学习苦于泛化能力差,只能针对单个任务来从头开始学习。  5年前,AlphaGo打败世界围棋冠军李世石,举世惊呼。自AlphaGo之后,Deepmind又推出能

竹祭瑰颈
2年前 (2022-09-02)

靠近紫色立方体或将黄色球体放在红色地板上」。长此以往,AI智能体从新手小白成长为屠龙勇士,吃鸡、捉迷藏都难不倒它们。    基于此,一个由任务空间组成的、超大规模的「元宇宙」XLand就诞生了,几何地球只是其中的

痴妓北渚
2年前 (2022-09-02)

是为了让自家通过强化学习训练的AI,能够玩遍「全宇宙的游戏」。  这个世界的任务由游戏、世界、玩家构成。根据三要素的不同关系,来决定任务的复杂度。复杂度则由竞争性,平衡性,可选项,探索难度这4个维度评判。  从简单到复杂的游戏,AI智能体通过第一人称视角去感知游戏中环境,并且不断尝试、碰撞游戏

语酌柠木
2年前 (2022-09-02)

,从中累积庞大数据来训练自己完成游戏目标。  简单的比如「靠近紫色立方体」,复杂一点的比如「靠近紫色立方体或将黄色球体放在红色地板上」。长此以往,AI智能体从新手小白成长为屠龙勇士,吃鸡、捉迷藏都难不倒它们。    基于此,一个由任务空

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。