当前位置: 华文问答 > 数码

AI 绘画的用处已经被彻底发掘了吗?还有哪些潜在应用方向?

2023-11-30数码

我认为AI绘画的用处还没有被彻底发掘,AI绘画还有很大的发展空间,尤其是后续的AI视频是很大的应用方向。

我用Runway制作的视频 https://www.zhihu.com/video/1717298359570853888

AI绘画用处方向挖掘

随着人工智能的飞速发展,AI绘画已经不断呈现多种应用形式,其中,动画制作领域更是取得了显著的成果。

以中国传媒大学动画与数字艺术学院为例,近期他们利用AIGC(人工智能生成内容)技术打造的水墨动画短片【龙门】,入围第三届巴西Tietê国际电影奖实验短片单元。这无疑让我们看到了AI绘画未来的方向。

【龙门】海报

但是,AI绘画和AI视频的能力,还远远超出我们的想象。

【龙门】片段截图

AI绘画和视频的结合还可以将动画故事在不同的媒体平台之间进行无缝衔接,为用户提供统一且连贯的叙事体验;为教育和培训领域提供定制化的动画和视频教程,帮助用户更有效地学习和掌握知识。

AI视频平台

最近一个多月来,AI视频迎来了众多新闻,让人更加期待AI视频领域的革命性成果。以下我按照最近发布的时间顺序来介绍各个AI视频平台的成果

1. Runway

11月3日,Runway的Gen-2发布了支持4K超逼真清晰度的里程碑式更新。

Runway官网截图

我当时尝试了下这个提示词,可以看到动态效果还是十分震撼的:

The dark sky saw the meteor shower falling, and huge fireballs fell into the forest, burning fiercely
中文翻译为:漆黑的天空看到流星雨落下,巨大的火球落在森林里面,火焰熊熊燃烧 我用Runway文生视频的生成内容 https://www.zhihu.com/video/1717294469622419456

11月21日,Gen-2又上线了运动笔刷新功能。

我采用Fooocus生成图片,然后试用了下运动笔刷改变天上的背景:

11月21日,Gen-2又上线了运动笔 https://www.zhihu.com/video/1717298439933501440

Runway的网址:

2. Meta

官网截图

11月16日,Meta发布了Emu Video,据称在用户评估中击败了Gen-2、Pika等竞争对手。

Emu Video 官网视频 https://www.zhihu.com/video/1717304233781702657

我也进入网站,但是没有找到运行的界面,只截取了部分网站上展示的动画效果

Emu Video 官网视频 https://www.zhihu.com/video/1717304264274288640

Meta Emu Video 网址:

3.字节跳动

官网截图

11月18日,字节跳动在发布了PixelDance,其作品具有前所未有的动态性。

在官网中,PixelDance 给出了两种不同的视频生成模式。

第一种是基础模式 (Basic Mode) ,用户只需要提供一张指导图片+文本描述,PixelDance 就可以生成有高度一致性且有丰富动态性的视频,其中指导图片可以是真实图片,也可以利用现有的文生图模型生成。

PixelDance官网视频 https://www.zhihu.com/video/1717306871801769984

第二种是高级魔法模式 (Magic Mode) ,给了用户更多发挥想象力和创造力的空间。

在这种模式下,用户需要提供两张指导图片+文本描述,可以更好地生成更有难度的视频内容。网站中展示了用魔法模式做出的各种炫酷特效镜头。

PixelDance官网视频 https://www.zhihu.com/video/1717307370290659329

PixelDance的网址:

4.Stable AI

11月21日,AIGC领域的佼佼者Stable AI,在开源了AI绘图大模型(大名鼎鼎的Stable Diffusion)和AI文本大模型(Stable LM)之后,如今终于完善了自己的多模态集合,推出了全新的开源AI视频大模型——Stable Video Diffusion。

官网截图

这一系列的创新成果,标志着他们在人工智能领域的研究已经覆盖了图像、文本和视频等多个模态。

SVD官网展示效果

Stable Video的网址:

5.PIKA

11月29日,创业公司Pika发布了正式版1.0网页版,引起了全网爆火。

官网截图

Pika的具体效果如何呢?我引用知名博主 @数字生命卡兹克 公众号上的一个视频来给大家看下效果,他也是PIKA的超级合作者,全网首批获得1.0测试资格的博主。

Prompt:Cinematic, happy laughing girl in office, Pixar style
图片来源于 @数字生命卡兹克 公众号
Cinematic, extreme close-up of cars on the road in a jungle, 3D rendering
图片来源于 @数字生命卡兹克 公众号

而图生图的效果也十分惊艳

图片来源于 @数字生命卡兹克 公众号
图片来源于 @数字生命卡兹克 公众号

Pika的网址是:

6.美图秀秀

12月5日,美图秀秀在「美图创造力大会」上发布自研AI视觉大模型MiracleVision(奇想智能)4.0版本,并公布了美图WHEE的视频功能。

在发布会上发布了WHEE具备文生视频、图生视频、视频运镜和视频生视频四大功能

在文生视频方面,输入提示词,就能生成一段视频。

花丛中的兔子摇头晃脑,汽车行驶扬起的尘土,恋人在森林中旋转,每个场景的动作、光影、细节都恰到好处。
图片来源于美图公司官方公众号

图生视频让图片也动起来。

从景深变化到细节动作捕捉,MiracleVision可以轻松生成。非常的自然流畅,就像专业摄像机拍出来的。
图片来源于美图公司官方公众号

在图生视频的基础上,MiracleVision支持视频运镜。

提供了推、拉、摇、移等八种电影级运镜模式,让用户能够轻松模拟专业的镜头运动,演绎更加丰富的镜头语言。
图片来源于美图公司官方公众号

视频生视频方面,导入如「男生开车兜风「的视频,再加上不同的提示词,就能获得卡通、科幻、像素风,羊毛毡等不同的艺术风格,非常的酷。

图片来源于美图公司官方公众号

而在电商和广告领域的视频运用也十分惊艳

图片来源于美图公司官方公众号
图片来源于美图公司官方公众号

美图秀秀的MV4.0版本据称将于2024年1月进入各产品应用。美图WHEE的网址:

结语

我一直觉得AI绘画的用处还没有被彻底发掘,AI绘画的进一步延展就是AI视频,视频让图片动起来,让AI绘画应用更加多元化。

我的AI绘画作品

现在,如此多的AI视频特色产品纷纷亮相,让人不禁要问:AI视频是否已经迎来了爆发期,人工智能的新一轮高潮又要来临了吗?

我是德里克文,一个对AI绘画,人工智能有强烈兴趣,从业多年的室内设计师!如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!