你知道制作这个视频背后技术吗?

大谷表示,「使用了开源AI绘画项目Disco Diffusion」。


据大谷介绍,这个视频自己耗时10天才完工。

这期间,大谷全程负责「监工」,盯着AI干活,并提供给AI需要的摄像机镜头位移坐标,补充一点场景文字信息。

到后期再填上字幕和微调剪辑,就完成了这个作品。



而他做这个视频的动机很简单,

想要研究一下AI的绘画潜力怎么样。

那么这个AI作画的能力究竟如何?我们来个「慢镜头」欣赏一下...

「转身那一刻,世界崩落」这句歌词一出,

开场画面中,粉色的童话世界瞬间变成了万丈深渊的魔域世界,让人有一种很大的视觉反差。



再来看,AI根据歌词「天空如同被雷鸣闪电划破、玫瑰盛开」填画的表现力也很不错。

其中像「闪电」和「玫瑰」这样的关键信息都在画面中生成了。



但是,当你仔细盯着这个动画不要眨眼睛时,是不是真有种自己吃了云南毒蘑菇的感觉。

天旋地转,简直太魔幻了...



Boom,Boom,Boom,Boom歌词一出,AI作画的风格就很诡异了...

很明显歌词中都在说的是,心跳Boom。

而AI却把炸弹、烟花、气球,白色框框杂糅到一个画面中。



这画风,这调调和整首歌的意境不太相融了。

可以说,AI的智商在理解句子上没问题,而理解整首歌词内涵还是不太够(doge)。

到了最后收尾,AI从前面很有意境的风格转化成了赛博朋克风。

星际飞船、行星、宇宙...



就比如下面这个场景很类似「黑客帝国」中尼奥从母体诞生周围环境的一幕。



可以看到,AI根据输入的文字歌词和场景描述生成了每一帧画面中的世界。

每一幅画面亦真亦幻,似梦非梦。


技术介绍:AI作画「卷」出新高度


在介绍这个工具之前,先来看两张图片。





看完这两张图片,你可能会觉得,这是哪个大牛插画师的作品。估摸着,这么精良的作品,放到市场上卖个几千不是啥大问题。

如果真是大牛画的,那还真没什么亮点了。虽然很好看,但也不是不能完成的。

可如果,这两幅画,还有一大堆别的一样好看的画,都出自AI之手呢?

你会不会觉得不可思议?

真相是:这两幅画的作者都是Liliia Sitailo。准确来讲,Sitailo只负责输入指令,作画部分完全交由AI完成。



如果你让我说,这么完美的构图、清晰的思路,还有身临其境的氛围、抓人眼球的色彩,都是AI完成的,我还真不一定信。

事实证明,这款谷歌开发的名为Disco Diffusion的AI作画工具非常之成功。目前,这个工具已经更新到了第五代,V5版本。



这是一款由谷歌Colab平台开发的,利用人工智能深度学习进行数字艺术创作的工具,基于MIT许可协议,目前已开源。

用户可以在谷歌Drive直接运行。

有了这个工具,不需要用户懂什么构图知识,也不需要有任何艺术细胞,只要想点子就可以了。

另外,大家熟知的DALL-E也同样在4月迎来了更新。

Open AI对画图界的扛把子DALL-E进行了2.0版的全面升级。让自然语言生成图像达到了全新的高度。

比如下面这幅很有穿越感的画。



还有之前占据AI画画老大哥地位的Imagen,做了一副「有点怪,我再看看」的画。



谷歌除了上面提到的Disco Diffusion,最近也有一款名叫Parti的画画AI问世了。

Parti,全名叫「Pathways Autoregressive Text-to-Image」,是谷歌大脑老大Jeff Dean提出的多任务AI大模型蓝图Pathway的一部分。

我们来看看Parti的作品:



看完后,是不是顿时感觉,会画画的AI都这么卷了...

大谷是谁?


提到大谷,你一定会立马想到「AI复活」系的专业户。



大谷1991年生于北京,获得了纽约视觉艺术学院电脑艺术硕士学位。

作为一个艺术家,音乐家,程序员和独立的游戏设计师,生产力真是爆炸。

此前,我们已经看到过很多由他创作的一些作品。

最出名的就是用AI修复100年前老北京影像。发布后,这段修复Vlog爆火,引来许多网友的关注。



另外,像他用AI修复让李大钊、陈延年等老先辈们露出笑容也得到网友一致好评。



还有AI还原宋明清三朝皇帝、泰戈尔、梅兰芳,百年前上海时装秀....



所以说称其为「AI复活专业户」也不为过。

不过,这次大谷却为我们带来了不一样的创作。