茉莉花新闻网

中華青年思想與行動的聚合地

实测 PixVerse V6 暴力出片:快,才是最贵的 | 爱范儿

我输入了一段 prompt,按下生成。手还搁在键盘上呢,视频已经出来了。

画面前景是一杯冒着热气的黑咖啡,背景模糊;随后焦点平滑转移,清晰展现出背景中一位翻阅旧书的女孩。

改了两个词,把光线方向调了一下,再按一次。又出来了,质感没掉。提示词写得很随意,就是脑子里的画面用大白话说了一遍,没有刻意堆关键词,模型全听懂了。

▲提示词:前景是一杯正在冒着热气的黑咖啡,占据画面主导位置,背景模糊。随后,镜头焦点自然地转移到背景中,清晰地展现出一位正在翻阅旧书的女孩。

这是 PixVerse V6 给我的第一感受。不是「效果好」三个字能概括的,准确说是「这个效果,居然这个速度就出来了」。

PixVerse 出片快,这件事圈里不算新闻。大多数 AI 视频工具还在用排队考验耐心的时候,PixVerse 已经是同类里生成速度最快的选手。在 Artificial Analysis 的视频生成模型排行榜上,PixVerse V6 更是处在第一梯队。

2 17

不过如果 V6 只是「更快了一点、画质更好了一些」,那它只是一次常规迭代,不值得单独拿出来聊。

V6 做的事情,是把「快」从一个技术参数,变成了一种创作层面的结构性优势。指令理解强了,提示词不用反复打磨;画质也更稳了,这些环节省下来的时间叠在一起,比单纯的生成速度提升值钱得多。

换句话说,当出片质量够稳定、速度够快,创作者的瓶颈就不再是工具,而是想法本身 。AI 没有让创作者贬值,它反而让好想法比以前更值钱了。

不只是快,每一帧也经得起放大看

PixVerse V6 的操作本身没有任何门槛,新手也能轻松上手。

打开拍我 AI(网页端地址:https://pai.video),在输入框里用自己的话描述想要的画面,选好分辨率、画面比例和时长,点生成就行。支持 360P 到 1080P 输出,横屏竖屏都能选,单次生成时长可以自己控制。

V6在指令理解上有了肉眼可见的进步,只需简单描述创作意图就足够,无需堆砌专业术语,它明白你要的是什么光线、什么氛围、什么景别,这也导致省下的不仅是时间,还有反复推敲提示词的精力。

也支持上传参考图。想还原某个风格、想锁定角色长相,把图扔进去就行,模型会参照着生成。

3 3

V6 最让我意外的进步在于物理仿真。

我试了一段微距镜头。金黄色蜂蜜缓慢滴落,拉出晶莹的丝线,落在松饼上缓缓散开。丝线被重力拉细,接触面的扩散速度也和蜂蜜的黏度匹配。

它有重量,有重力,有因果。

4 3

▲提示词:微距镜头。高粘度的金黄色蜂蜜正缓慢地从木质搅拌棒上滴落,拉出长长的、晶莹剔透的丝线,最后重重地落在下方刚出炉的松饼上,蜂蜜在接触面缓缓散开。画面具有极强的真实物理运动逻辑。

以前 AI 视频里的物理世界是「会动的像素」,V6 里的物体在遵守物理定律。这一点的意义超出视觉层面。我们判断一个画面真不真,靠的是一种直觉:这杯水倒出来的方式对不对?这滴蜂蜜落下的轨迹合不合理?V6 在这个层面上交出了一份像样的答卷。

物理仿真解决的是世界真不真实,而人像质感解决的是人的质感对不对。

这是 AI 视频最容易翻车的科目。稍有不慎就是恐怖谷。五官精致但表情僵硬,皮肤光滑但质感像硅胶,眼睛很亮但眼神没焦点。你能认出这是一张脸,但直觉会告诉你,这不是一个人。

V6 在这方面让我重新有了新的审视。一些圈内创作者拿它和 Seedance 放在一起比,结论基本是:两者互有胜负,很难说谁压过谁。

我试了一段中年男性演员的面部特写,他正努力克制哭泣的冲动,浅景深,柔和侧光。出来的结果很难让人移开视线。鼻翼轻微颤动,眼角湿润,这几个动作之间有时间差,有层次,有内在逻辑。

5 1

这种微表情的层次感,让人物开始有了一种 AI 演员的即视感。对比之下,以前 AI 人像的情绪更接近「状态切换」,V6 里的情绪有了过程。皮肤质感的取向也值得单说——肌理,毛孔、细纹、光线下的皮肤色差都保留。

打斗戏是 AI 视频的体能测试。

拳头要打在正确位置,被打的人要有合理反应,身体运动惯性要连贯,多角色空间关系不能穿模。任何一个环节崩了,就变成搞笑视频。许多 AI 视频模型的生成结果要么是两个人在做体操,要么挥拳的手臂穿过了对方的脸。

在体验 V6 的过程中,我生成了一段大雨滂沱的泥泞小巷里,两名武术高手正在激烈近身肉搏的场景。一记重拳击中对方下颚,雨水和汗水随冲击飞溅,受击者的面部肌肉因冲击力产生真实的震颤。

6 1

画质之外,真正让我兴奋的是 V6 补齐了一套镜头语言能力。

变身特效方面,我生成了一台科技感极强的机械无人机在空中急速飞行,随后快速从金属形态幻化为一条由流动墨水和水墨线条组成的、散发幽蓝光芒的水墨神龙。

7 1

▲提示词:中国风动漫风格,无人机在飞行过程中快速从金属形态幻化为一条由流动的墨水、墨点和水墨线条组成的、散发着幽蓝光芒的水墨神龙。

过渡自然,没有常见的像素闪烁和边缘残影。金属的硬度和水墨的流动之间有一个过渡状态,两种质感都没有被粗暴切断,整个变身过程更接近融合,而非替换。

运镜能力同样有惊喜。电影级航拍视角下,一台无人机在废弃的、生锈的工业厂房内部急速穿行。厂房的空间感、金属质感的光线处理、高速运镜时画面的稳定性,三件事同时做到位,没有出现 AI 常见的那种「不知道该看哪」的混乱感。

8 1

▲提示词:电影级航拍视角,现实主义风格。一台无人机在废弃的、生锈的工业厂房内部急速飞行。

还有一个方向是子弹时间。黑客帝国式的视角旋转,主体定格,背景动态延续。这类镜头对时间感的控制要求很高,稍有偏差就会变成慢放,V6 处理得比较克制,速度分层是有的,没有用力过猛。

6 2

我还试了两个对空间穿越要求更高的场景。第一个是课堂。无人机视角从走廊切入教室,镜头跟着这股气流穿出教室,拉到整个校园上空。试卷和白纸被气流卷起,满天都是,运镜轨迹却没有断。

1 6

第二个是蜜蜂从窗缝挤进来,穿过卧室、客厅,找到厨房里的蜂蜜罐再飞出。每个房间光线和景深都不同,换场时蜜蜂飞行惯性有轻微滞后,和真实昆虫的节律对得上。

5 2

多镜头切镜可能是对实际工作流贡献最大的能力。一段时尚女装广告短片,三个镜头的衔接流畅,色调温暖统一,没有 AI 的拼凑感。

9 1

还有三个我比较喜欢的运镜和场景调度的测试。

比如一架纸飞机在维多利亚式书架间起飞,书本跟着腾空排成隧道,随后场景切进脑内微观世界,神经元在半透明星云状组织里闪着荧光,像缩小版的银河系。

11 2

同样是纸飞机在图书馆迷宫里做非线性飞行,俯冲、侧滑、擦边过障碍,镜头紧紧跟随,转弯时有强烈的侧滑感,没有糊掉。

10 2

前脚还是琥珀暖色的图书馆,进入脑内世界后立刻切成深蓝和深紫,但因为运镜没有断,切换反而变成了一种视觉冲击,并不突兀。

3 4

这些能力单拿出来每一项都是加分项。组合在一起,意味着 V6 开始具备完整的镜头语言能力了。

最后一个让我印象深刻的点,不是画面,是声音。

V6 在开启 Audio 之后,音频适配有了明显增强。我试了一段微缩模型视角的场景:远处火山正在喷发,小人国村民四散奔逃,一只巨大的手拿着透明碗从天而降,将整个村庄罩住,透明碗落下的瞬间带着空气被压缩的细微震动。

4 4

特别是 ASMR 类场景。下雨天的窗户、篝火噼啪声、书页翻动。这些画面本身就追求沉浸感,音频质量直接决定你是在看视频还是沉浸在场景里。

一个人暴力出片叫效率,一群人暴力出片叫生产力

如果 V6 只是一个更快更好的 AI 视频模型,故事到这里可以收尾了。但 PixVerse 显然不打算只讲到这里。

据了解,这次同步上线了两个东西:Team Plan 和 Mini Apps。

Team Plan 是给 2 到 15 人的工作室用的。核心机制很简单,团队共享一个积分池。

不再是每人一个账号各算各的,而是整个团队统一消耗,按角色分配权限。老板看全局,创意总监管项目分组,剪辑师专注出片。个人空间的素材和模板一键同步到团队空间,不用在群里来回传文件。

12 11

听起来不复杂,但解决的问题很真实。以前工作室用 AI 视频工具,就是每人开各自的账号,出了好素材在群里互传,版本管理靠文件命名加日期。这跟十年前用 U 盘传 PPT 没什么本质区别。

Team Plan 做的事情,就是把 AI 视频从个人工具升级成了团队生产线。一个人连出十条挑最好的叫个人效率,五个人各出十条,五十条里挑一条炸裂的,叫团队生产力。

Mini Apps 走的是另一条路。使用方式简单到不需要解释:上传几张商品图,系统自动帮你剪成一条完整的广告视频。不用懂剪辑,不用知道什么叫镜头语言。

13 7

一个淘宝店主、一个小红书博主、一个街边奶茶店老板,都能在几分钟内拿到一条可以直接发的产品视频。

2 4

V6 模型是给创作者的武器,Mini Apps 是给所有人的傻瓜相机。当创作门槛被压到零,暴力出片就不只是创作者的方法论了,它变成了人人能用的基础设施。

快,才是最贵的画质

画质够好,速度够快,成本这道关也值得单独说一说。

720p 分辨率常态成本大概为每秒 0.04 美元,放在当前市场里已属低位,对应的却是第一梯队的生成质量,4 月 7 日前购买会员至高打七折,生成时积分消耗再减免 30%,进一步把规模化出片的成本压了下来。

14 4

这让我想到摄影从胶卷到数码的变化。

胶卷时代一卷 36 张,按一次快门前得在脑子里构图三分钟,因为每一张都有成本,但快门本身的质量没有区别。数码时代的摄影师怎么拍?因为每一张都清晰、都够用,所以可以连拍 200 张,事后选构图最好的那张。没人会说这「不严肃」,因为最终给观众看的永远是那张最好的。

V6 让 AI 视频创作进入了这种「数码时代」。

而 PixVerse 对「快」的理解,也早已超出了生成速度本身。

从早期的高速生成,到 R1 的实时交互,到 V6 的强指令理解让描述变得更自然,再到 Team Plan 把协作效率拉到团队量级,这条线串起来,体现的是 PixVerse 在多个维度上同时提速:生成速度快、指令理解准确、协作效率提升。

支撑这一切的,是PixVerse扎实的模型迭代能力。

能在排行榜上持续保持第一梯队,靠的是每一代产品都在扎实啃硬骨头,物理仿真、人像质感、镜头语言,每一项都是难而正确的方向。V6 的初衷很纯粹:让创作者把精力放在创意上,其余的交给工具。

当一个工具把高质量的生成变成了触手可及的日常,又把使用门槛压到零、把协作效率拉到团队级别,它就不再只是一个「模型」了。它正在变成内容时代的基础设施。

PixVerse V6 开启了 AI 视频的暴力出片时代,快到不讲道理,好到能直接交片。

这个时代才刚开始。

作者:李超凡、莫崇宇

同类信息

查看全部

茉莉花论坛作为一个开放社区,允许您发表任何符合社区规定的文章和评论。

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram