公司地址:
新闻资讯国际企业科技园4381号
AI 视频体育游戏app平台,还能往哪个标的卷?Luma AI 的谜底有些不落俗套。敌手还在练一招一式,它却像风清扬传授独孤九剑,认真生动变通,如鸿篇巨制,苟且所之。
Luma AI 大概不如可灵、Runway 有名,但论实力也在第一梯队,它的视频模子叫作 Dream Machine,本年 6 月发布,最近进行了重磅升级,是推落发具以来威望最大的一次。
其中包括两项更新,一是发布我方的图像模子 Luma Photon,将翰墨、图像、视频一锅端;二是打造了生成 AI 视频的全新职责流,咱们可以像和 ChatGPT 聊天一样,让 AI 生成视频,毋庸对教唆词惜墨如金。
对于生成视频这件事,Dream Machine 首创了一种很新的方式。
指路👉 https://dream-machine.lumalabs.ai/
聊着聊着,就把视频给生成了
大开 Dream Machine,咱们先看到的是「Board」,可以将它剖析为无穷的创意画布,在这里,咱们使用天然言语,摆脱地生成图像或者视频。
运转一块 Board,我的教唆词写得十分浅易:「创建一个日式悬疑少年漫画的脚色。」
AI 扩写了我的教唆词,一次生成了 4 张图片,然则不行,年代不合。
不蹙迫,再在对话框输入一句,「放在当代布景」。
AI 示意懂了,又生成了 4 张图片,右上这张孤身走暗巷,还是接近我想要的嗅觉了,但仍然不够,我想要他抬动手,显现五官。
不难,不息微调,忘掉复杂的教唆词,和 AI 打直球就可以。
右下这张可以,天然形象幼态了点。接下来,我想让 AI 生成一个视频,主角在合并条胡同里从白昼走到暮夜。
Dream Machine 生成视频的首尾帧功能,即是为这种需求准备的——咱们挑好头尾的两张图片,让 AI 补足中间的历程。
那么,咱们只需基于舒心的图片,让 AI 生成几张白昼场景的,换取方式照旧一样的浅易狞恶。最终摄取的两张图片,细约莫有落差,但同框也不违和。
万事俱备,只等生成视频,AI 过渡得还算天然。
看到这里,你应该昭彰 Dream Machine 和其他视频器具的差别了。
其他视频器具,频繁是给你一个填入教唆词的文本框,然后让你树立运镜、时长等参数。树立一次,生成一次。
但 Dream Machine 的界面,看起来十分像和聊天机器东谈主交互,底部是输入框,文生图、图生图、图生视频、文生视频,皆可以在这里进行。
专科创作家可以不息写传统的教唆词,但咱们也领有了「讲东谈主话」的权益,压力给到 AI,Dream Machine 能够剖析高下文,帮咱们完善教唆词,咱们可以从一个十分毛糙的方针运转,和它边聊边改边优化。
又因为 Dream Machine 是无穷画布阵势的,咱们可能在一个身手反复生成,素材皆会保留住来,不会彼此掩盖。
咱们的想维,不会局限在一段教唆词、一个视频,而是像水一样流淌,更多的方针,可能就在这个历程里产生了。
更可控的图片,更可控的视频
Dream Machine 的全新职责流就像大树的骨干,其中一些好玩且实用的功能则像枝叶,井水不犯河水,才能枝繁叶茂。
起到重要作用的,即是 Dream Machine 最新发布的图像模子 Luma Photon。
图片何如生成得更合乎咱们的审好意思?Dream Machine 扶植格调参考和脚色参考功能。
先说格调参考,咱们可以导入我方的图片,AI 会将格调融入到创作中。官方给出了一个例子:按蒙德里安格调,生成小鸟版的《戴珍珠耳饰的青娥》。
按这个想路实操一下,基于男性侦查的形象,参考梵高《星月夜》的格调,生成女性侦查。
二次元遇上后印象派,化学响应很奇妙。
脚色参考功能,则可以通过一张图片,就终了脚色的一致性,让这个脚色出目下更多的图片和视频里。
马斯克是行走的素材库,这么的例子太没挑战性了,我决定让甄嬛瞬移到哈利波特的寰宇,看场景变了之后,她还能不成气场两米八。
扫尾有些不好评价,看得出来是甄嬛的式样,但娘娘的长相入乡顺俗,五官尤其眼睛,变得更像泰西东谈主了。
其实,不另外找图片参考,Dream Machine 也可以让图片、视频不泯然于世东谈主,这时辰就要用到「头脑风暴」功能,它会字据你生成的图片,保举一些艺术家的格调。
就像甄嬛进霍格沃茨这张,咱们可以用吉卜力职责室格调二创。宫崎骏说过,AI 是对人命自己的侮辱,但施行是,吉卜力还是是 AI 的一个选项,尽管有形无神。
不仅如斯,教唆词里的一些重要词,被框选了起来,能用下拉的选项替换,Dream Machine 称之为「见解药丸」,咱们毋庸我方手写教唆词,一键更换艺术格调,或者画面元素。
把「吉卜力」换成「新海诚」,把「独角兽」换成「龙」,不外点击几下的功夫。
Luma Photon 模子,基于 Luma 的通用 Transformer 架构构建。通过设备我方的图像模子,Luma AI 可以减少对 Midjourney 等外部图像模子的依赖,同期也能料理文生视频不褂讪的问题。
天然,视频是资本行,镜头率领这种可控性功能,Dream Machine 也少不了。
紫禁城的甄嬛,和霍格沃茨的甄嬛,能不成终了丝滑的转场呢?用推拉镜头,画面有动感,东谈主物莫得严重的变形,可以打个 80 分。
视觉的想维,讲故事的方式
巧的是,前两天 Runway 也官宣了我方的图像生成模子 Frame,和 Luma 更新是合并个晚上,看演示就知谈十分留心审好意思,目下正徐徐向 Gen-3 Alpha 盛开阅历。
Runway Frame
图片的生成质地、好意思学高度,以及视觉格调的一致性和可控性,越来越被视觉模子意思意思了。
这对创作家来说是善事,当咱们用 AI 进行平面野心、脚色设定时,其实即是在生成一个特有的寰宇,讲一个特有的故事。
Runway 的 CEO Cristóbal Valenzuela 认为,Runway 不是一家 AI 公司,而是一家媒体和文娱公司,AI 公司的时期还是扫尾了。
他不是在唱衰 AI,正值相背,他认为 AI 是一种基础设施,委果的更正不在于手艺自己,而在于它所终了的东西:新的抒发阵势、发扬故事的新方式、相接东谈主类体验的新要领。这和 Luma 的进化标的一口同声。
此次更新之后,Luma AI 首席践诺官兼聚拢创始东谈主 Amit Jain,给 Dream Machine 下了一个很真理的界说——视觉想维配结伴伴。
见解有些概述,他的真理其实即是,让生成图片、视频这么的视觉创作,像聊天一样浅易、直不雅。
交互的方式,影响着咱们想考的方式。画布式的职责流,能 将脑洞可视化,纪录统统的创作历程和扫尾,呈现生成视频的完好想路。
无穷画布频繁在图像模子较为常见,比如 Recraft 和 Ideogram 的 Canvas。Dream Machine 的画布愈加规整,一样教唆词生成的素材和变体横向罗列,不同的则竖向罗列。
边聊边生成边优化的历程,会让东谈主以为,一个孤苦的小寰宇仿佛在画布里出身。
先让 Dream Machine 用超写实电影 CG 格调,创造一个工业废土布景游戏的主角。
然后用环绕镜头,让主角动起来,并塑造环境的空间感。
接着,咱们可以再和 AI 聊,让 AI 不息生成废土寰宇不雅里室内室外的各式场景,让 AI 冷漠咱们何如塑造得更有末日气味。
某种进度上,这个画布,即是咱们个东谈主故事的设定集。
天然,Luma AI 的 bug 也好多,包括但不限于,用一张图片终了脚色一致性,后果并不睬想;积分如活水,图片和视频照旧要反复抽卡;图片模子可以生成准确的英文,但汉文不行......
但真理传达到位了——少谈参数,以交互为起点,构建一个 AI 创作器具。
更好的视频模子,不仅仅有更快的生成速率、更可控的镜头率领、更特有的好意思学,它应该也提供更好的讲故事的方式,让翰墨、图像、视频皆行为抒发方针的器具。
Dream Machine,造梦机器。
只管去创作吧,如同 Luma AI 的这句话:「不需要写复杂的教唆词,问就好了。」翌日 AI 留给咱们的问题体育游戏app平台,不再对于手艺,而是对于咱们用它构建什么 。
Dream教唆词Luma甄嬛视频发布于:广东省声明:该文不雅点仅代表作家本东谈主,搜狐号系信息发布平台,搜狐仅提供信息存储空间就业。