热门关键词:kok体育电竞,kok官网,kok电竞体育  
当前位置:首页 > 企业新闻
kok电竞体育-人工智能的想象力在哪里?微软的这个机器人画家告诉你答案
2021-04-29 [52212]
本文摘要:按:人工智能需要构建什么?

kok电竞体育

按:人工智能需要构建什么?毫无疑问,它能帮助我们建立许多事情,但微软公司最近开发的人工智能技术创造了我们对人工智能的理解。基于计算机识别和自然语言处理,微软公司开发了可以根据用户说明绘制的机器人,也有助于用户重建未必说明的细节。

目前,微软公司已经通过官方博客发了这个成果。(公共编号:)对这个博客展开了不改变意图的编译器。例如,你手里拿着原稿纸和画笔,被拒绝画鸟的照片。

这只鸟需要黄色的身体、黑色的翅膀和短鸟的嘴。你不会再画鸟的大致轮廓了之后,检查变更,看黄色的身体部分,用黄色的画笔填满鸟的身体。然后用黑色的画笔完成鸟的翅膀,最后检查一下,画出短发光的鸟的嘴。

为了更生动的形象,可能会画鸟栖息的树干。现在机器人也可以像你一样做了!微软公司研究实验室开发的新型人工智能技术需要从字幕式的文本叙述中提取单一的语言分解图像。网站ar西安v.org公开发表的研究报告显示,根据业界标准测试的结果,该技术产生的图像质量与以前的文本到图像分解技术相比提高了约3倍。研究人员非常简单地称为绘画机器人,该技术可以分解从普通田园风景(耕畜等)到可笑无意义的(浮动的双层巴士等)的所有图像。

每个图片都包括文字描述中没有提到的细节,指出人工智能技术享有人工想象力。用Bing搜鸟的话,就得不到鸟的照片。然而,在这里,图片是由计算机一个接一个地从头开始创建的,它位于华盛顿州雷蒙德市的微软研究实验室,深度自学技术中心的首席研究员和研究主管Xiaodonghe回应。这些鸟在现实世界可能不存在——只指出了计算机对鸟类的想象力。

该绘画机器人技术已经完成了他和同事在过去五年中探索的计算机视觉和自然语言处理的交叉学科研究。他们从自动写照片的字幕——CaptionBot的技术开始,转向别的技术,询问对象的方向和属性等图像明确提出的问题,对盲人特别简单。这些研究工作必须训练机械学习模型来识别对象,完成不道德和自然语言之间的交流。现在我们用文字分解图像这个组织的博士后研究员、论文年度出版者QiuuanHuang回应。

所以,这是一个循环。图像分解是比图像字幕更具挑战性的任务,团队中的副研究员PengchuanZhang必须在标题中画出细节。这意味着必须运营人工智能的机械学习算法来想象图像的缺陷部分。

kok电竞体育

细致的图像分解微软公司绘图机器人的核心是被称为分解对付网络的技术。网络由两个机器学习模型组成,一个是从文本叙述分解图像,另一个是鉴别器,用于文本叙述分解图像的真实性。

发生器试图通过假照片识破识别器,同时识别器进行识别。两者一起发生,发生器大大极限。微软公司的绘图机器人在包括相应图片和标题的数据集中进行了培训,这些允许模型自学如何将单词与这些单词的可视图像相匹配。

例如,GAN学在标题上说鸟的时候分解鸟的图像,在某种程度上自学鸟的图像应该是什么样的。他说:这是我们相信机器能自学的根本原因。

从非常简单的文字描述(如蓝鸟或常青树)产生图像时,GAN学校可以很好地工作,但在更简单的文字描述中效果不好,如绿冠、黄翅和红腹鸟。这是因为整个句子作为发生器的单一输出。其中详细信息再次丢失。因此,分解的图像不是与叙述中密切给定的,而是带有绿色和微黄色的鸟。

kok电竞体育

在人类绘画过程中,我们反复提到文本,并密切关注我们绘制的图像区域和单词描述。为了猎取这样的人的特质,研究者创立了所谓的attentionalGAN和attnGAN,在数学上模拟了人类关注的概念。它是通过将输出文本分解成单词,将这些单词与图片的特定区域相匹配来构建的。

注意是一个人的概念,我们用数学计算。他说明了。该模型还从训练数据中自学到人类称为常识的东西,利用这个自学的概念填补想象中图像的细节。例如,由于训练数据中的许多鸟类图像显示了躺在树枝上的鸟,AttnGAN一般使鸟类栖息在树枝上,除非文本有其他规定。

从数据来看,机械学习算法自学鸟应该站在树枝上属于这样的常识Zhang。作为一项测试,该团队为漫画图像获得了绘画机器人所需要的字幕,如一辆红色的双层客车浮在湖面上。

它分解模糊、独特的双层巴士图像,类似于双层甲板船和双层甲板船,浮在山周围的湖上。图片指出,船只能浮在湖泊和公交车的文字叙述之间,机器人内部有争斗。我们可以控制我们说的话,考虑机器如何反应。

他解释说,我们可以介入和测试机器教什么。这台机器已经有背景常识了,但它仍然可以根据你拒绝的操作。

有时候,这可能有点荒谬。从实际应用到图像的分解技术,可以作为画家和室内设计师的素描助手,也可以作为语音控制的照片美化工具使用。

kok官网

预示着更强的计算能力,他想象这个技术可以分解基于电影剧本的动画电影,为电影制作者增加人工费。但是,现在这个技术还不完善。仔细检查图像后,总能找到蓝鸟嘴等缺陷,而不是黑色的,水果和基因突变的香蕉很宽。

这些缺失正确地指出,不是人类构这些图像,而是计算机。尽管如此,AttnGAN图像的质量比以前最差的GAN图像的质量提高了近3倍,这是加强人类自身能力的人工智能道路的里程碑。因为人工智能和人类生活在同一个世界里,所以他们之间必须找到交流的方法。

语言和视觉是人与机器交流的两个最重要的方法。除了微软公司的Xiaodonghe之外,PengchuanZhangandQuyuanhuan合作伙伴还包括前微软公司实习生利理海大学的Taooxu和杜克大学的ZheGan、罗格斯大学的HanZhang、理海大学的XiaoleiHuang。关于参考资料1.读者关于AttnGAN的研究论文2.了解更多关于微软公司在视觉和语言智能方面的知识3.查阅关于AI的研究成果3.查阅关于CaptionBot和SeeeingAI这两个应用于4.几十年的计算机视觉研究,SwissArmyKnifeViablogs.microsoft。


本文关键词:kok体育电竞,kok官网,kok电竞体育

本文来源:kok体育电竞-www.glenncook.net