微软AI单凭文字就可作画,什么人首先受到撞击?
分类:彩世界注册首页

GAN通过从高维的分布中采样,生成模型输出与训练样本类似的新样本。这就意味着,人工智能系统能够创作出任何类型的形象,例如飘浮的双层巴士、放牧中的牲畜等,而且在文字中欠缺的一些细节,系统会在影像中自行补完。

目前来说,微软这个绘图AI还是有比较大的提升空间,而在不断改进后,在将来,它可能会对漫画领域产生极大的冲击,甚至于对室内空间设计行业也会产生影响。当然,其主要作用还是节省画家和设计家的人力和时间,而令人期待的是,未来的电视上极有可能会出现由AI自导自演的动画片。

43.25万美元 (约300万人民币),成交。  我叫Edmond de Belamy,是这个星球上第一幅参加艺术品拍卖的AI画作。  从今天起,我就有新主人了,虽然还不知道ta的名字。  1968年,毕加索说,计算机是没用的。  2018年,我身为AI的作品,也能和人类画作共处一室一同参加活动,又是压轴出场。  这场佳士得拍卖会为期三天,里面有20多幅毕加索的画,没有一幅比我拍出的价格高。  比如,这一幅毕加索的版画,落锤时只有10万美元。  不止毕加索,全场三百多件拍品,也只有一幅比我的成绩更好。  大概,我已经是艺术品了。这种感觉从未如此真实。  只是,我的身世似乎出了一些问题,还引发了艺术圈的不适。  我一直以为的身世  作为一幅刚刚拍卖成功、并有些膨胀的AI画作,请允许我详细介绍一下自己:  我出生在法国,一个叫做Obvious的艺术团体里。  当然,它不是单纯的艺术家团体,里面除了艺术家,还有AI研究人员。  这些人类,不自己作画,而让GAN (生成对抗网络) 来画画。  GAN是一种自攻自受双重人格的AI,身体里藏着一个“画师”,一个“鉴赏家”。  只要用大量人类画作来投喂AI,“画师”会学着生成自己的画,“鉴赏家”就负责鉴定,哪些画是人类所作,哪些是“画师”生成的。  “画师”努力骗过“鉴赏家”,“鉴赏家”尽量揭穿“画师”。一来二去,两种人格都越来越强大,GAN的画作便越来越逼真。落款,是GAN的价值函数,这很AI,也很艺术  我就是GAN的肖像作品。图像生成之后,印在帆布上,又镶在镀金的木质画框里。  不过,我并不是Obvious团队唯一的画作。  看我的名字“Edmond de Belamy”,可能也想象得到:我背后有个庞大的家族,姓贝拉米 (de Belamy) 。  贝拉米,来自法文的“Bel Ami”,好朋友的意思,是为感激Goodfellow发明了GAN,把他的姓“翻译”成了法语。  我只是家里的一个小辈,今年才出生。11人家族  有人说,我的五官好模煳,像没画完一样。也有人说,我的构图有问题,整个人飘在画布的左上角。  不过就算这样,我还是没有辜负家族的期待,成了世界上第一幅走进艺术品拍卖会场的画作。诚惶诚恐。  拍卖,是命运的拐点  要去佳士得的消息,我8月底就知道了。  我参加的是多版艺术品 (Prints and Multiples) 的拍卖场次,地点是纽约的洛克菲勒中心,从当地时间10月23日持续到25日。一共363件拍品,我是最后一个出场。  所谓“多版”,有时指画作并非一次创作完成,作者在过程中产出了许多长相相似的画,是谓“Multiples”。 Buste de femme d’après Cranach le Jeune  比如,这幅毕加索作品,和我拍出了同样高的价格。  如果放在摄影、雕塑之类的艺术品身上,“多版”通常指作者本人、或作者联合某些艺术工作室,对自己的作品进行复刻,是谓“Prints”。比如,安迪·沃霍尔的一张玛丽莲·梦露 (Marilyn: One Plate, 1967) ,也是这场拍卖会上有名的选手,16万美元落锤,总价20万美元。  熟悉的面孔还很多。上场之前,我真的有些紧张。一只手速很快的拍卖师  我的起拍价定在5,500美元,估值7,000-10,000美元。历经55次出价,终以35万美元落锤,新主人是一位匿名电话买家。  加上佣金和其他费用,我的身价一共是432,500美元 (约合300万人民币) ,是估值上限的40多倍,我无论如何也想象不到。  这般美好的结局,可能不止是写给我的,应该也会写进历史,是艺术史。  1766年,佳士得在英国诞生,那是乔治三世统治初期,也是工业革命刚刚开始的时候。  2018年,走过两个多世纪的佳士得,成了第一间接受AI画作的艺术品拍卖行。  虽然,AI生成的图像究竟算不算艺术,这个问题一直没有定论,252岁的佳士得还是给了世界一个很年轻的回答。  身世有了争议  自己的画作有朝一日能入佳士得的法眼,可能是很多人类画家的期待。  但就算佳士得在艺术界的分量再重,把像我这样的AI画作看成艺术品的做法,依然有许多艺术家和鉴赏家不能认同。  第一个理由,是认为GAN是学过千千万万人类的画,然后拼凑出自己的画。它跳不出框框,看的是肖像,画不出自然风景。像贝拉米家族诞生的过程,称不上原创,也就算不得艺术。  针对这个想法,我的主人据理力争:就算人类学画画,也要看过别人的作品。人类创作,也要借鉴前人的灵感。Obvious团队:创造力不只人类有  何况,GAN是会学习的,看过千万幅画之后,并非机械地拼凑,而是摸索人类作画的方法,用于创作。主人们觉得,只要生成的是谁都没见过的画,自然是原创。创造力不是人类独有的。  我,这幅刚刚落锤的AI画作,在诞生之初,大概也是谁都没见过的。  至于,艺术是否一定要原创,可参见同一场拍卖会上,安迪·沃霍尔的另外一件作品:  这幅米老鼠,拍出了超过32万美元的总价。  第二个理由,是人类的情绪,艺术要有情绪。画家Robert Prestigiacomo说,如果没有毕加索的愤怒,就不会有格尔尼卡。而AI没有情绪,所以没办法让人类感受到艺术作品背后的态度,不论是喜悦还是愤怒。  关于这一点,AI作曲家AIVA写的交响乐,被许多科技大厂用作发布会开场曲,包括英伟达。由此可不可以认为,AI的作品也能调动起人类的情绪,让观众更加兴奋地迎接后面的活动?  第三,我等AI画作的版权归属问题,也是争论的一个焦点。  这还关系到,我整个贝拉米家族的根源,到底是不是Obvious团队。  有传闻说,家族的诞生,是依靠一位美国少年开发的算法,而他并不属于这个社团。  少年叫做Robbie Barrat,19岁,刚刚高中毕业,但训练GAN的经验已经很丰富了。 切颗脑 (左) 与半兽人 (右)  Robbie日常向自家AI投喂一些果体人像画作,培育起一只污污的GAN。  为了造福人类,少年把算法开源了,就在这里:    讨论区,赫然可见Obvious团队成员,向少年请教能否改动这个算法。  如果,我贝拉米家族是大量借用Robbie算法而生,是不是应该用更加显着的方式,标明Robbie对画作的贡献?  可是团队一直不急于澄清这件事。直到今天拍卖结束,才表达了对Robbie的感谢,但只是称他为艺术家,并没有提到算法。  Robbie本人发推质疑,Obvious是不是拿着他的神经网络去赚钱。  Obvious表示冤枉,晒出训练过程,表明并没有使用预训练的模型。Obvious还放出了几个月前的聊天记录。  其中,Obvious请求使用Barrat的部分代码,用于艺术创作,也用来为自己的研究寻找资金来源。  Barrat当时也表示,100% Okay。  围观者甚众,观点不一。有人觉得,既是开源算法,任何人都有权利在其基础上深入发展。也有人说,就算是开源算法,也要看授权是否包含商用。当然,“看别人挣了钱才眼红”也是一种看法。  我的出身引发了争议,也引起了艺术社区不小的担心。 弗朗西斯·培根:Study of Red Rope  在赝品泛滥的艺术品市场,人类们更加不希望“局外人”,就是那些用AI生成画作的研究人员,搅混了水。  未来,如果像我这样的AI画作被广泛地认定为艺术,版权问题可能就更加复杂。比如,用开源代码自己生成的画,该怎样界定版权归属?  那时,艺术家们要维护自己的权益,也许会更困难。  挡不住的“AI艺术”  关于AI进行的“艺术”创作,人类艺术界的确充斥着纷杂的声音。  但这些,都不能减损人工智能领域的开发者,想要无限靠近艺术的热忱。  而且,GAN也不是唯一的工具。  2014年,谷歌开发了DeepDream,用卷积神经网络 (CNN) 找到图像的一些特征,用可视化的方法来放大这些特征,就生成了梦境一般的图景。  这些梦境,画风大多非常诡异,AI便也因此声名远播,吸粉无数。  2016年,谷歌在旧金山举行了一场慈善拍卖,29幅AI作品一共筹得97,605美元,其中最贵的一幅拍出了8,000美元。  只不过,当时的名义并非“艺术品拍卖”,也就没有引起艺术圈的大范围排斥。  除此之外,还有与GAN相映成趣的CAN。它不是常见的生成对抗网络,是创造性对抗网络。  差一个字母,差在GAN是要让AI画作靠近人类的作品,区分不出来就是最好;而CAN追求的是不同,作品要和数据集里的东西有天壤之别才好。  以下这些就是CAN的造诣了。 罗格斯大学的研究人员,是真的想帮AI摆脱模仿的枷锁,放飞自我。  拥有创造力,可能是走向艺术的一大步。  那么,你觉得我算艺术品么?  以及,如果你有300万,是买我,还是毕加索的那幅画?

据了解,法国一个艺术家团体 Obvious,最近给算法系统投喂了 1.5 万张 14 世纪到 20 世纪之间的肖像画。AI根据大数据画出了一整个虚拟的 Belamy 家族,而其中一张《Edmondde Belamy》将在 10 月 23 至 25 日由佳士德拍卖行进行拍卖,预计售价会在 7000 到 10000 美元之间。

AI口述绘画,看起来好像是机器接受人类指令给出图画,但远远不止这么简单。智能相对论(微信id:aixdlun)了解到,正如负责研发的Microsoft深度学习技术首席研究员何晓东说的,图像是人工智能由零开始,逐像素逐像素创作。他以一幅人工智能创作的黄色雀鸟图像做解说,表示人工智能分析文字后,再透过一项名为生成对抗性网络(GAN,Generative Adversarial Network)的技术将文字转化成图像,人工智能创作的黄色雀鸟并不一定在现实世界存在,只是电脑的一种想像。

据悉,谷歌的这项研究是通过编程让计算机自学如何执行各种不同的任务的一种方式,常见的方式是给计算机注入标签数据来进行“训练”。

人工智能系统单纯透过文字描述就能够创作图像,该技术在文字描述中寻找关键字词,然后再用来创作高画质的图像,据悉这个关注重点的技巧让图像的画质较之前提升3倍。

这次的拍卖AI画作的新闻一出,就吸引了业界大量的关注。只是大家聚焦的焦点各有不同,有的人是看好AI画作的艺术价值,而更多的人是看好AI作画背后巨大的商业价值。

在鸟的例子中,机器人画的鸟通常是站在枝头上的,然而文本内容中其实并没有提到这一细节。这是因为数据库中提供给它的图像经常出现类似的内容。这意味着,AI在掌握了一定的知识面后也能将其利用起来形成自己的想象。

编辑|新物语

从这个逻辑上来看,微软AI“看文作画”绝不仅仅是一个商业应用的技术加持,也不仅仅是艺术与科技的碰撞,更重要的应该是开启了AI世界里使AI具有想象力的新纪元。

其实这不是AI作画第一次出现在公众的视野当中,早在Obvious利用AI作画之前,就已经有科技大佬看好AI作画的发展前景,进行AI作画的研究了。

所以,AI口述绘画这件事,不可小瞧!

如今,AI作画已经在某些领域有了实际的应用,如去年AI作画技术就被美图秀秀搭载,进行了产品升级。去年年初,美图秀秀就推出了可以让用户瞬间变身漫画手绘形象的手绘自拍功能。该特效一推出便风靡全球,上线第一天就获得了1500万用户的使用。上线不到3个月,手绘自拍特效的全球使用次数超过5.2亿次。在App Store美国地区免费应用总榜上,美图秀秀一周内排名蹿升至第11名。这不仅是美图旗下app的最好成绩,也是中国影像类软件在美国市场的最好成绩。

接着,一座美丽的花园跃然于纸上,花园中有各色的花朵,飞舞的蝴蝶,甚至有两个小孩在其中嬉戏。

除此之外,AI作画也可以在绘画教学领域发挥作用。因为对于学校或培训机构来说 ,AI绘画可以作为教具使用,减轻老师负担,提升学员绘画乐趣。而在家庭中,AI作画除了教育功能,还可以作为孩子和家长的交互工具。目前,盖范教育就因为做AI作画教学产品,获得了百万天使轮投资。

绘画机器人能够想象出标题中没有包含的细节,这是因为,它有一点自己的常识和想象力,当然,这要依赖于它大量的训练数据。

AI 画的画,会有人愿意掏钱买吗?

微软的这只鸟,更深远的意义在于,我们或许距离摆脱机器人纯粹的“运算”更近了一步。

这些训练主要通过神经网络模拟人类大脑的运作过程,其互相连接的层可识别输入信息(比如图像)不同的模式。低级别的层可能含有响应光明与黑暗简单的像素级模式的神经元。而高级别的层则可能会响应狗的脸、汽车或者蝴蝶。等绘图数据输入之后,该网络会尝试想出它在处理的东西的一般性规则,利用这些规则就可预测人们的涂鸦意图,随后自动完成常见对象的涂鸦。

AI据文绘画,或许漫画领域最受冲击

例如,去年Google实现了让软件来自动完成用户的涂鸦。这是一款 web 应用程序,它结合了神经网络的力量,能够在用户几笔简单的描画后,基于最佳预测来自动完成常见对象的涂鸦。

                                       来源 | 智能相对论(aixdlun)

AI画的画不但有人买,甚至还将卖到几千上万美元。

AI先天具备的是运算能力,从而进行仿人类智慧的智能模拟,第二步就是模仿人类的感知,比如机器识别、语音识别、语义分析等等,都是在做这件事。而第三步,就是让AI 有自己的“想象”和“思考”。

彩世界注册首页 1

GAN通过从高维的分布中采样,生成模型输出与训练样本类似的新样本。这就意味着,若生成模型的训练数据是鸟的图像集,那么训练后得到的模型也能输出类似于鸟的合成图片。

AI作画领域的研究

想象力是人在已有形象的基础上,在头脑中创造出新形象的能力。比如当我说起牛奶,你想到的图景可能是杯子中盛着白色的牛奶,这个想象是基于你生活中的经验所得到的,也就是说,想象一般是在掌握一定的知识面的基础上完成的。

综上来看,AI作画将有广泛的市场应用,尤其是在有着千亿市场的漫画领域,将有很大的发展空间。相信,随着AI作画技术的不断改进,我们将来一定能在电视上可以看到由AI自导自演的动画片。返回搜狐,查看更多

值得一提的是,微软研究人员在此基础上创建了他们称之为注意力生成式对抗网络或AttnGAN的技术,这个AttnGAN生成的图像的质量比之前最好的GAN生成的图像质量提高了近三倍。而这种仿人类注意力的生成式对抗网络对AI界的影响十分重大,这标志着在类人类智能的发展实现了质的突破。

再比如,近几年来我国的动画产业正在蓬勃发展,据统计我国动画总产值从2012年的760亿元增长至2017年1572亿元,年均复合增长率为15.6%,预计到2022年我国动画行业总产值将达到2240亿元。庞大的市场需要更多的从业人员,而随着AI作画技术的成熟,未来AI作画技术能够根据电影剧本生成动画电影,进行一些重复且繁琐的手工绘画,这将节省很多的人力,也将促进我国动画产业的快速发展。

马云曾说:“三十年后,《时代》杂志封面年度最佳CEO说不定是个机器人。”

责任编辑:

“Drawing bot,请你为我画一个花园。”

作者|与非们

机器人CEO可能还需等待,但机器人绘画师已经在路上。

AI口述绘画,看起来好像是机器接受人类指令给出图画,但远远不止这么简单。正如负责研发的Microsoft深度学习技术首席研究员何晓东说的,图像是人工智能由零开始,逐像素逐像素创作。他表示人工智能分析文字后,再透过一项名为生成对抗性网络(GAN,Generative Adversarial Network)的技术将文字转化成图像。

                                                                 文 | 颜璇

AI作画的商业价值

彩世界注册首页 2

这些科技大佬的研究,促使者AI绘画技术的发展。并且随着AI技术的成熟,AI作画技术除了可以用于作品的临摹和创作,还会带来很多实际应用,比如,它可以作为漫画家和室内设计师的素描助理,这将是一块很大的市场。

“看文作画”的AI在现实生活中又会发挥什么样的用处呢?

此外,当Google的AI正在涂鸦时,微软AI已经可以按需绘画了。今年,微软对外宣称正计划推出一项新的人工智能技术——绘图机器人(drawing bot)。使用者仅需说出想要绘制物体的名称,机器人便可以进行相关素材的匹配,也就是说,未来可以通过口述的方式进行绘画。

什么是AI口述绘画

原标题:智识聚焦 | AI 作画,不仅只是进行拍卖那么简单

让我们来想象一下,未来,可能会发生这样的对话——

彩世界注册首页 3

研究员称人工智能系统能够创作出任何类型的形象,例如飘浮的双层巴士、放牧中的牲畜等,而且在文字中欠缺的一些细节,系统会在影像中自行补完。

随着人工智能时代的到来,艺术与科技的碰撞,越来越频繁地现身热门话题榜。AI“看文作画”的技术展现了具有艺术表现力的潜能,对艺术创作的影响已经可以预见。但微软的绘画AI,在撬动智能体想象力方面,意义绝对不只是“艺术助手”所能概括的。

人工智能可以模仿披头士写歌,当然也可以模仿各种名家作画。试想一下,一个没有任何绘画基础的编剧,却能在网上发布自己漫画剧作,其作品还颇有当代某著名漫画家的画风。在动漫方面,如果微软的这款绘图智能大力发展,完全可以大大降低创作门槛。当然,这种另类的“漫画创作”也可能面临素材版权的问题。

假如单纯的感知却无法自主输出,那么AI无非是更灵活的传感器而已。

想象力——让AI区别于死物

除了知道绘画AI可以充当更好的人类帮手之外,我们为什么要关注AI绘画这件事?智能相对论(微信id:aixdlun)认为,其中关键,或许是我们应该知道“想象力”在AI世界中的重要程度和期待指数。

智能相对论(微信id:aixdlun):深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。重点关注领域:AI 医疗、机器人、智能驾驶、AI 硬件、物联网、AI 金融、AI 安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。

目前,AI只是在小的细节中进行补充,而下一步,应该是试图在更自主地描绘图像上完成突破。如果这个突破到来,意味着AI模型在“想象力”这一特质上得到了进一步升级。这个能让AI区别于死物的能力,终于拉开了表演的大幕。

从文本到图像的生成技术可以找到很多实际应用,它既可以作为漫画家和室内设计师的素描助理,或者作为语音美化照片的工具。如果有更多的计算能力,这项技术能够根据电影剧本生成动画电影,进行一些重复且繁琐的手工绘画,比如动画背景中的一棵树、一颗草,进而改善动画电影制片人的工作。

当Google的AI正在涂鸦时,微软的绘画AI 已经学会如何画鸟了。近日,微软对外宣称正计划推出一项新的人工智能技术——绘图机器人(drawing bot)。使用者仅需说出想要绘制物体的名称,机器人便可以进行相关素材的匹配,也就是说,未来可以通过口述的方式进行绘画,说啥画啥。

生成器必须反复用随机输入的噪音数据合成有意义的内容,直到判别器无法区分合成内容的真伪。这套框架正在被扩展应用到许多数据模式和任务中。如仿真时间序列的特征;超分辨率图像;从二维图像复原三维结构;小规模标注数据集的泛化;预测视频的下一帧;生成自然语言的对话内容;艺术风格迁移;语音和音乐的合成。

GAN结构用到了两个神经网络:一个是生成器,它试图基于输入的数据生成更像真实数据的结果;另一个是判别器,它的目的在于正确分辨哪些是真实的数据。简单地来理解就是,生成器总是在试图“骗过”判别器。

本文由彩世界注册首页发布于彩世界注册首页,转载请注明出处:微软AI单凭文字就可作画,什么人首先受到撞击?

上一篇:切磋 · 无界 | 距索爱Z18旗舰新品发布会还大概有 下一篇:没有了
猜你喜欢
热门排行
精彩图文