好莱坞导演对AI的恐慌,大概需要LibTV这样的产品来解决

好莱坞导演对AI的恐慌,大概需要LibTV这样的产品来解决p class f center p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 


最近一直在想一件事:

人跟人之间的信息传递,效率最高的方式是什么?

以前我觉得是语言,后来觉得是文字,再后来觉得是代码或者AI。

但现在我越来越确定,是视频。

为什么短视频能统治世界?因为它最符合人类大脑的底层偏好,视觉信息处理就是我们的本能。

但从另一个角度来说,视频也是门槛最高的表达方式。作为AI创作者,哪怕已经有20万粉丝了,我的视频表达依然存在障碍。

写一段文字,打开备忘录就能干。拍一条视频,就需要脚本、分镜、拍摄、剪辑、调色、配乐。

即使是用AI生成,也得在各个平台之间来回切换,生图用一个工具,生视频用另一个工具,剪辑还得再开一个软件。

流程碎得跟饺子馅似的,抽卡抽得跟赌徒似的,排队排一夜前面还有几百人……


是时候让Agent表演真正的技术了。

是时候轮到Agentic Visual Studio登场了。

前几天,我拿到了LibTV的内测资格,有点去年3月刚看到Manus的喜悦感,但LibTV完成度更高。


官网:https://www.liblib.tv/

我在想,不管是从token需求的角度、还是消费性的考量,视频Agent理应比去年的文本Agent,有更大想象空间。

下面带大家看看我的使用感受。

01LibTV:一块画布、一部电影

LibTV是LiblibAI他们家新推出的为专业创作者准备的 AI 视频创作平台。

好像不知不觉,Liblib系已经形成AI视觉家族了,很有种Agentic Visual Factory智能工厂的感觉。

这次LibTV有啥不一样呢?它同时做了两件事。

第一个,是给人类创作者准备了专业入口——一块无限大的画布。


可以在这块画布上,摆放剧本、分镜、角色设定、视频片段、配乐音效。

所有东西都在同一个空间里,抬眼就能看到整个项目的全貌。


跟着自带的视频指示,走一遍,就理解了,很容易上手。

9 / 25 宫格分镜生成、一键生成完整故事板、剧情推演四宫格、快速测试不同剧情走向、多机位 9 宫格镜头设计、模拟真实影视机位调度;

还有角色三视图生成、快速建立稳定角色设定、画面时间推演:自动生成前 3 秒 / 后 5 秒画面延展……

各种首创的功能和组合,都在画布里,满足专业视频创作的复杂需求。

第二个,是给Agent准备了一个Skill入口。

那些正在快速进化的个人AI助手,比如小龙虾,可以通过Skill接口直接调用LibTV的创作能力。用Agent的协同,完成从剧本到成片的全部工作。


都说26年的产品要Not for Human, for Agent,但LibTV说,我全都要。

这个设计思路很有意思。

过去二十年,软件产品的成长路径几乎都是同一条:

先做一个好用的界面,把用户圈进来,做到足够大以后再开放API,让开发者来做集成。GUI是正门,API是后门。

但Agent的出现打破了这个先后顺序。

当软件的调用者不再只是人类,而是同时包括成千上万个Agent的时候,API不再是长大以后才需要考虑的事。

它从第一天起就和GUI同等重要。

LibTV,是视频创作领域,第一个从Day1就把人和Agent当作两个平等用户来设计的产品。

丰富的功能,也让创作者不再只是生成单个画面,开始能真正组织一整套视频创作流程、完成一支完整的视频作品。

事情变得更有趣了。

02怎么玩:从无限画布说起

打开LibTV,开始创作,首先看到的就是画布,乍一看很简洁。

但当开始在上面有点击的动作,就会发现藏了很多后手。

无限画布上,有4大功能模块:

「项目菜单栏」「画布左侧栏」「个人中心」和「小地图导航」。


在项目菜单栏里,一个无限画布就是一个项目,点击画布左上角的 Logo 会弹出「项目菜单栏」可以对项目进行管理。

画布左侧栏,设有「添加」「工作流」「资产」「历史记录」「教程」5大功能。

画布右上角,是用户相关功能,包括「发布&分享」「通知」「会员中心」「积分消耗」「个人中心」。

左下角的小地图导航,我尤其喜欢,跟打游戏看地图一样。

然后关键的来了,一个最核心的构成要素:节点。

画布上,有五种基础节点:文本节点、图片节点、视频节点、音频节点、脚本节点。


先带大家看看文本节点。

通过集成了多个语言模型的文本生成器,可以输入自然语言需求或结构化提示词,让语言模型完成对应的文本生成任务。

生成的结果,会展示在「文本节点框」中。

相当于是说,5种不同模态的生成能力,在LibTV里可以自由控制,用节点进行连接和组合。

再也不用先产出文字脚本、再生图、再配乐、然后图生视频等等,不用切换网页、存来存去的,在一个画布里,把完整视频该有的步骤全搞定。


五种节点,让我想起了曾经玩ComfyUI的日子,connecting the dots真的很有趣。

而现在的LibTV,就更容易上手、更好玩了,逻辑上似乎和从Stable Diffusion到Liblib的迁移如出一辙。

让我觉得厉害的,还有工作流功能。

所有节点之间都可以连线,搭建出一条能反复跑的创作流水线。

比如我调出了一条比较顺手的流程:参考生图→图转视频→高清增强。

我把这套流程存成了资产,以后做类似项目的时候,打开画布、换一批输入,就能复用整套流程,不用每次都从零开始。

下面就是一个简单的「参考生图→图转视频」工作流,带大家感受一下。

工作流创建好以后,就像这样


LibTV还塞进去一堆很实用的预制功能。

多机位九宫格、剧情推演四宫格、25宫格连贯分镜、角色三视图、画面推演前后几秒……

这些都是输入指令就能直接调用的魔法。

不用自己设计工作流,只要选中素材、触发指令,它就帮你生成一整块结构化内容。


03再说说Agent

前面的部分似乎还是workflow的范畴,属于视频流程的AI化改造。

但从Agent开始,事情又不一样了。

这个部分更科幻。

我在龙虾对话框里输入了一句话:给我的耳机做一个宣传片,风格参考这个视频链接。

然后把一个参考视频的URL扔了进去。


接下来发生的事情让我有点恍惚。

我的Agent自己去LibTV调用了复刻TVC Skill,自动解析原片的镜头语言和风格,生成剧本,设计分镜,调用模型生成视频片段,最后剪辑成片。

整个过程我没插手一下,它就给我交出了一条30秒的宣传片。


录屏里能看到,Agent在后台自己搭建节点、连接工作流、调整参数,像一个看不见的实习生在那儿埋头干活。

虽然生成的时间有点长,毕竟要跑好几个模型,但最后出来的成片质量,说实话,比我手动做的第一条还要好。

我还试了另一个Skill:短漫剧生成。

输入创意描述,Agent自动完成了剧本、角色设计、分镜、视频、音效、剪辑,给我交付了一部完整的2分钟短剧。

主题是《坠入深海》,讲了一个挺有意思的惊悚寓言。效果就不错下面


这种感觉很奇妙。以前是我指挥工具,现在是我跟Agent协作。

我负责给方向和审美判断,它负责执行和扩展。创作这件事,第一次有了交响的感觉。

04为什么我觉得LibTV不一样

用下来,有几个点让我觉得这产品确实想清楚了。

第一,它真的懂创作者需要什么。

LibTV目前上线了20多个专业视频创作功能,其中好几项是行业首次推出。9/25宫格分镜生成、一键生成完整故事板、剧情推演四宫格、多机位9宫格镜头设计、角色三视图生成、画面时间推演……

这些功能不是拍脑袋想出来的,一定是跟大量创作者聊过之后才知道他们真正缺什么。

我以前做分镜,最烦的就是一张一张生图然后手动拼板。


现在一键生成,省下的时间可以用来琢磨镜头语言本身。我以前调整角色设定,最烦的是换一个角度就得重新抽卡。现在角色三视图生成,一张图搞定正面侧面背面,人物设定稳定多了。

这些细节说明产品经理是真下场做过活的。

第二,它在定价上狠起来连自己都砍。

之前抽卡,有的产品,抽一张两块,抽一百张两百块,做个几分钟的视频下来,成本轻松破千。

LibTV的定价我看了一下数据:年卡最低39折,部分模型还有额外6折优惠,会员SKU价格比竞品低76%,模型积分定价比竞品低92%。换算下来,相当于你用两折多的成本,就能跑出同样的作品。

现在开会员,还会给订阅用户赠送最多150条可灵O3+150条可灵3.0,共300条免费最高等级的视频,任意使用。

价格屠夫这个词用在这里一点不夸张。

第三,它押注了一个正在发生的变化。

AI的能力正在经历第三次跃迁。第一次是学会对话,第二次是学会调用工具,第三次是学会理解复杂任务、自主编排工作流、在项目级上下文中持续迭代。

正是这第三次跃迁,让传统的软件产品必须做出改变。

Agent已经成熟到可以作为独立的创作主体参与工作,它需要的不再是一个API,而是一个为它设计的、任务级的能力入口。

LibTV为Agent设计了Skill入口,让Agent可以像人一样理解任务、调用能力、完成创作。

随着社区的丰富,你的Agent可以在LibTV上执行越来越复杂、越来越贴合你审美的创作任务。


这也是在为即将开启的Agent to Agent时代做准备。

05关于Agent、命令行、审美

更深一层想,LibTV想做的其实不是工具,而是一种新的创作结构。

命令行也许更适合效率类的工具,但是文艺创作的价值,恰恰在于人本身的参与。

一部电影之所以好看,不是因为画面技术上完美无缺,而是因为某个镜头里,有一个只有这个导演才会做出的选择。

我始终相信一件事:真正决定作品高度的,永远是人的判断与审美。

AI可以帮你生成一万个镜头,但只有你知道哪一个镜头是对的。Agent可以替你完成整个制作流程,但只有你知道这个故事想表达什么。

而LibTV的节点、工作流、Agentic Skills……让审美变成了可执行、可流通、可积累的东西。

人在创作,Agent在学习,社区在流转,工具在进化。四件事同时发生,没有先后,没有边界。

到最后会发现,它成了一台驱动审美的引擎——越来越高质量的作品,自然地从系统里长了出来。


LibTV让我看到了一种可能性:当工具足够强大,当Agent足够聪明,创作者终于可以把精力从繁琐的执行中解放出来,去思考那些真正重要的问题——

我想讲一个什么故事?我想让观众感受到什么?这个镜头为什么要这么拍?

这些问题,AI回答不了。但它们才是一切创作的原点。


从国内导演圈、制作圈到好莱坞,普遍有种对AI来临的恐慌和焦虑。

但在我看来,像LibTV这样的产品,已经事实上

不妨试一试:https://www.liblib.tv/

如果想研究一下背后的技术原理,GitHub在这里:https://github.com/libtv-labs/libtv-skills

小讯
上一篇 2026-03-19 22:50
下一篇 2026-03-19 22:48

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/244816.html