每当麦当娜在巡回演唱会上演唱上世纪 80 年代的名曲《La Isla Bonita》时,她身后巨大的舞台屏幕上就会播放出夕阳下云朵旋转的动态图像。
为了获得这种空灵的效果,这位流行音乐传奇人物使用了生成式人工智能中仍处于起步阶段的一个分支--文本到视频工具。输入一些词语,比如 "超现实的云霞 "或 "黎明丛林中的瀑布",就能立即生成一段视频。
继人工智能聊天机器人和静态图像生成器之后,一些人工智能视频爱好者表示,这项新兴技术有朝一日可能会颠覆娱乐业,让你能够选择自己的电影,并定制故事情节和结局。但要做到这一点,还有很长的路要走,而且途中还有很多道德陷阱。
对于像麦当娜(Madonna)这样长期挑战艺术极限的先行者来说,这更像是一次实验。她放弃了早期版本的 "La Isla Bonita "演唱会视觉效果,该版本使用更传统的计算机图形来唤起热带风情。
"我们尝试过 CGI。麦当娜庆典巡回演唱会的内容总监萨沙-卡修哈(Sasha Kasiuha)说:"我们尝试过 CGI,但它看起来很平淡、俗气,她不喜欢。"然后我们决定尝试人工智能。
ChatGPT 制造商 OpenAI 最近展示了一款尚未公开的新工具 Sora,让人们看到了复杂的文字视频转换技术的雏形。麦当娜的团队试用了纽约初创公司 Runway 的另一款产品,该公司去年 3 月发布了首个公开的文字视频模型,成为这项技术的先驱。该公司于今年 6 月发布了更先进的 "Gen-2 "版本。
Runway 公司首席执行官克里斯托巴尔-巴伦苏埃拉(Cristóbal Valenzuela)说,虽然有些人认为这些工具是 "一种神奇的设备,你输入一个单词,它就会变出你脑海中的内容",但最有效的方法是让创意专业人士对他们已经使用了几十年的数字编辑软件进行升级。
他说《Runway》还不能制作一部完整的纪录片。但它可以帮助填充一些背景视频,或 b-roll,即有助于讲述故事的辅助镜头和场景。