可灵AI2.0:技术新高与价格新高

读娱 2025-04-23 13:43:06

文|零壹

4月15日,快手推出了可灵AI最新的2.0视频生成模型与可图2.0图像生成模型,据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

同时,可灵AI正式推出多模态编辑功能,支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

可灵2.0的发布,标志着快手在AIGC领域的技术护城河进一步拓宽。从技术性能到应用场景,其突破性升级为行业树立了多维度的标杆,但同时,高昂的价格也在国内视频大模型中“独树一帜”——使用可灵2.0生成一段5秒的视频需要消耗100个“灵感值”,以充值价格换算也就是10元,这远远超过了即梦AI、vidu以及可灵1.6的价格。

技术新高与价格新高,在人工智能技术狂飙突进的2025年,可灵AI将行业推向了一个新的临界点。

可灵AI 视频2.0有多强?

我们先看看可灵AI2.0具体升级到了怎样的程度。

据快手高级副总裁、社区科学线负责人盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。也就是说,可灵AI在目前主流视频生成模型中已经有了比较明显的优势。

在可灵AI的官方升级介绍文档中,可灵 2.0视频模型升级主要体现在三个方面:更强的语义响应、更优的动态质量、更美的画面质感。

其中“语义响应大幅提升”是指:动作、表情、运镜响应更佳,支持描述时序更复杂的镜头,助你轻松创作大片级画面。官方案例中对比了可灵 2.0与1.6生成内容的对比视频,第二个视频尤为明显,提示词大意是女孩坐在公园长椅上的时间过度天空色彩变化,1.6视频中直接切换了一个远景镜头来体现“天空色彩”,而2.0则全程保持在原镜头范围内进行了合理的色彩变化,这对于影视作品的叙事来说显然提升了一定实用性。

其二是动态质量大幅提升。角色/主体的动作幅度更大,速度更流畅,复杂动作也更加细腻、更自然、更合理,让你身临其境,充分感受视频画面的灵动活力。

官方视频举例了“恐龙朝着镜头冲过来,运动模糊,镜头抖动”的生成镜头,这一组对比中可灵 2.0的效果的确十分惊艳,在读娱印象中的确是目前主流视频AI中做得最好的。

不仅如此,在目前网络上发布的大量可灵2.0的视频来看,其在骑马飞驰、追逐这类运动性镜头中的优异表现绝非是偶然,这一项的“炸裂”级别表现,很可能是可灵AI 2.0给当下的影视产业带来冲击最大的部分。

特效制作向来是影视制作中的成本大头,而可灵AI 2.0在这些短镜头中的表现,可以说已经超过了我们印象中不少网络电影和院线电影。这至少意味着,在短片、广告短片这些行业之中,可灵2.0已经能够带来革命性的改变。而如何将这样的工具应用到电影、电视剧的实际项目操作,以怎样的形式嵌入到创作流程之中,也一定会成为下阶段影视制作行业中争相尝试的一环。

其三是画面美感大幅提升。官方介绍是“角色更真,动作、表情堪比专业演员;画面更细,文生视频可响应影视级别的画面描述,大片质感、纤毫毕现;风格更美,图生视频可以更好地保持原图画风,延续更多美感。”但在读娱看来这一点有些牵强,比不上动态质量提升那样惊艳。

除了2.0模型外,可灵AI这次发布的另一个重磅升级是「视频多模态编辑」功能。用户可以上传一段5秒内视频,基于视频+文字/图片,对视频替换元素、增加元素、删除元素,灵活对视频修改、再创作。

从实际应用来看,“视频多模态编辑”功能相当惊艳。官方视频中实现了将视频中的男性替换成一只熊猫,在空礼盒里加上毛绒玩具,把视频里飞行的鹦鹉直接毫无痕迹的删去,完全实现了“PS视频”的效果。

为了验证实际效果,读娱君在实操中将一段“猫咪做饭”动画中的猫咪替换成了一只小悟空,最终生成效果是非常准确的,可见这种惊艳表现绝不只是官方精挑细选出来的案例视频,而是非常实用的。

目前来看,可灵AI已经能够在广告创意、影视等专业领域展现出惊人潜力。模型生成的视频片段开始具备真实摄影的光影层次与运镜节奏,也具备了极为灵活的可编辑性。这种进化或将重新定义人机协作的创作模式,越来越多的行业将被AI视频模型所渗透。

技术降低门槛,价格抬高门槛

对普通用户而言,可灵2.0模型的使用成本进一步提升到了新边界,新技术高度带来了生产变革的前奏,但也是带来了新的价格高度。这也很可能会导致当下兴趣用户、个人创作者、专业机构的AI应用能力拉开差距,其中也许蕴含着未来AI内容生产资源逐渐层级化。

2.0模型的价格多贵?此前可灵1.6生成一段5S视频需要20灵感值,2.0则是100灵感值,也就是前者的五倍价格。

2.0的价格也远远超过了目前其他国产AI视频模型。以个人创作者常用的低档会员举例,可灵AI黄金会员连续包月46元/月,每月获得660灵感值,可以生成66个标准视频,若用来生成可灵2.0视频,则只能生成6个;

作为对比,国内创作者常用的即梦AI 69元/月的基础会员每月积分1080个,约生成视频360个;VIDU 59元/月的基础会员每月积分800个,约生成200个视频;sora目前目前只对ChatGPT的Plus和Pro会员开放;通义万相和豆包的视频生成目前还没有公共付费套餐,只有每日限定免费试用。

总体来看,可灵2.0的价格至少是即梦AI、VIDU的十几二十倍,也只有sora的价格门槛可以相提并论了。也难怪很多网友都认为,升级虽然可观,但也完美诠释了“一分钱一分货”。

在发布会上,快手高级副总裁、社区科学线负责人盖坤表示,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。

但可灵2.0的价格成本提升,显然会形成门槛和阻碍,尤其是对还不具备成熟商业化能力的“个人创作者”而言。这几天在不少AI交流群里讨论可灵2.0,核心角度几乎都是“确实牛,但也确实贵”。

比如以制作AI短剧来说,因为AI镜头一次出品就能用的概率是很低的,一般都需要一定数量的“抽卡”,即便按“抽卡3次”的较低频率来计算,一集3分钟的AI短剧需要108个5s镜头,如果用可灵2.0来制作的话,按灵感值计算成本可能要达到1000元以上。

不消说,这一成本已经超过“玩票”或者“兴趣”的创作者所能承担的了。所以可灵2.0带来的技术升级,肯定是没办法“让每个人都能用AI讲出好的故事”,目前还是只有影视公司、商业化打通的专业团队能够负担得起。

在《2025,AI短剧的爆发前夜?》一文中,读娱提到“所谓创作自由的新高峰,其实就是目前制作层面门槛的进一步消除,而对个人创作者在提示词、视听审美、剧本情感等等层面的高层次考验更进一步。”

对未来的判断有:在专业影视制作领域,AI会在创作流程中融为一体,随着AI作为技术噱头的标签被弱化,其存在感会越来越低,但应用场景则会越来越多;而当下定义的“AI短剧”,其爆发会来自大众创作者的无穷智慧。随着创作门槛被极度降低,“一人剧组”成为常态,普罗大众创意所产生的量变,会推动AI短剧的“奇点”出现。

而可灵AI 2.0的出现,从技术升级的角度进一步消除了制作层面门槛,但又从价格层面上抬高了门槛,理想中“创作门槛极度降低、一人剧组成为常态”的状态,显然还没有到来。

但对于AI创作者而言,可灵AI 2.0的出现必然是一个好消息。它的出现有力证明视频AI模型的极大潜力和实用性,在未来的所有视频领域里都将是一个无法回避的话题。个人继续打磨自己的提示词创意、镜头感等能力将变得越来越有价值,因为视频AI模型的升级还远未到终局——无论是技术水准还是未来的定价高低,都还远没到竞争出一个结果的时候,而“人”在其中起到最大作用不再是具体创作,而是作为创意舵手的把控力。

*原创文章,转载需注明出处

0 阅读:0

读娱

简介:泛娱乐商业新媒体,关注影视、音乐、动漫、体育。