正在阅读：DeepMind新进展：AI视觉系统可看到并理解空间DeepMind新进展：AI视觉系统可看到并理解空间

2018-06-19 10:09 出处：其他作者：PConline 责任编辑：liwen1

　　【PConline资讯】外媒报道称，谷歌母公司Alphabet旗下人工智能子公司DeepMind了解人类世界的方式，刚刚又前进了一大步。此前，该公司曾开发过一套教AI如何万视频游戏的系统。现在，它可以更好地“看到”并理解空间与环境，由此登上了不少媒体的头条。据悉，DeepMind的科学家们构建了一套人工智能视觉系统，其能够基于一张2D照片，来推断出一个3D场景模型。

DeepMind研究科学家AliEslami教授

　　在近日出版的《科学》（Science）期刊上，扎根伦敦的DeepMind公布了这套名为《生成查询网络》的新系统的一些细节。

　　此外，研究人员在官方博客上解释了"系统是如何从不同的角度拍摄一个场景，并建立3D视图"的：

　　当下最先进的视觉识别系统，是通过使用大量由人类产生的、带注释的图像来训练的。
　　获取这些数据，是一个相当昂贵且费时的过程，因其需要人们在数据集中的每个场景里，标记某个对象的方方面面。
　　结果就是，通常只有总体内容的一小部分场景被捕获，这就对使用这些数据进行培训的AI视觉系统造成了限制。

生成查询网络（GenerativeQueryNetworks）的图解

　　当我们在现实世界中开发更复杂的机器时，我们希望它们能充分了解周围环境，比如：

　　最近的表面在哪里？沙发的材质是哪种？阴影是哪里的光源产生的？电灯的开关可能在哪里？

AI观察与神经渲染

　　与死板的老方法不同，这种方式类似于鼓励人工智能系统进行想象：

　　那样即便没有相关学习经验或知识，机器也可以处理很多新鲜事物，甚至用来猜测这个世界。
　　它们需要被教导如何去想象，而根据其所‘见到’的信息来猜测，似乎是一种不错的方法。
　　虽然听起来有点可怕，但能让机器学习变得更接近人类的感觉，也算是一项重大的突破了。

GenerativeQueryNetworks

　　在今日发表的一份声明中，论文一作AliEslami博士指出：

　　其中一项研究发现，深度网络实际上能够在没有人类任何调教的情况下，学习诸如透视和光线这类知识。

　　据DeepMind所述，该方法不需要对特定领域的场景内容进行费时费力的工程标记，使得我们可以将相同的模型运用到不同的环境中。

　　尽管在投入实践之前还有许多研究要做，我们仍坚信这项工作已向着‘完全自主的场景理解’迈出了一大步。

相关文章

数码宝贝新世纪最强数码兽是谁【详解】数码大师中制作视频相册的详细教程在光影魔术手里通过数码暗房美化照片的操作流程数码大师中使用相框的详细操作方法数码大师里添加旁白的操作流程数码大师里添加歌词音乐的图文步骤 Linux 6.0对NTFS3内核驱动更新网开一面数码大师制作视频相册的具体操作方法数码大师制作滚动字幕的详细步骤 Linux 6.0为龙芯中科LoongArch架构启用PCI支持

聚超值·精选

关注我们

聚超值

热门排行

热门软件

PC软件 安卓应用 iOS应用 手游电脑版

游戏专区

资讯|曝《上古卷轴6》2025-26年发售背景在落锤省

资讯|塞班经典国产手游《七夜》高清重制版实机演示

资讯|《守望先锋2》加入计分板功能玩家：不能划水了

IT百科 热门专题

ETC免费办？当心猫腻

当心这种微信诈骗！

细思极恐！这些微信清粉软件可能暗含大阴谋

库克又对你的iPhone下手了，比让手机变卡更狠

除了反向绕行80公里，网约车还有哪些坑爹操作？

让你看得怀疑人生的支付宝账单，是怎么算出来的？

PPT制作软件

抢票软件大全

牛市炒股利器合集

看美剧软件大全

看日漫软件排行榜

安卓模拟器电脑版下载合集

汽车资讯

正在加载中...

成都车展宏光MINI EV 普拉多欧拉黑猫途达起亚嘉华玛奇朵皇冠陆放奔驰C级哈弗神兽坦克600 奥迪Q5 思域卡罗拉双擎E+ 轩逸太平洋汽车网app 新能源车

最新资讯离线随时看 聊天吐槽赢奖品