好莱坞导演对AI的恐慌，大概需要LibTV这样的产品来解决

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。
 
最近一直在想一件事：
人跟人之间的信息传递，效率最高的方式是什么？
以前我觉得是语言，后来觉得是文字，再后来觉得是代码或者AI。
但现在我越来越确定，是视频。
为什么短视频能统治世界？因为它最符合人类大脑的底层偏好，视觉信息处理就是我们的本能。
但从另一个角度来说，视频也是门槛最高的表达方式。作为AI创作者，哪怕已经有20万粉丝了，我的视频表达依然存在障碍。
写一段文字，打开备忘录就能干。拍一条视频，就需要脚本、分镜、拍摄、剪辑、调色、配乐。
即使是用AI生成，也得在各个平台之间来回切换，生图用一个工具，生视频用另一个工具，剪辑还得再开一个软件。
流程碎得跟饺子馅似的，抽卡抽得跟赌徒似的，排队排一夜前面还有几百人……

是时候让Agent表演真正的技术了。
是时候轮到Agentic Visual Studio登场了。
前几天，我拿到了LibTV的内测资格，有点去年3月刚看到Manus的喜悦感，但LibTV完成度更高。

官网：https://www.liblib.tv/
我在想，不管是从token需求的角度、还是消费性的考量，视频Agent理应比去年的文本Agent，有更大想象空间。
下面带大家看看我的使用感受。
01LibTV：一块画布、一部电影
LibTV是LiblibAI他们家新推出的为专业创作者准备的 AI 视频创作平台。
好像不知不觉，Liblib系已经形成AI视觉家族了，很有种Agentic Visual Factory智能工厂的感觉。
这次LibTV有啥不一样呢？它同时做了两件事。
第一个，是给人类创作者准备了专业入口——一块无限大的画布。

可以在这块画布上，摆放剧本、分镜、角色设定、视频片段、配乐音效。
所有东西都在同一个空间里，抬眼就能看到整个项目的全貌。

跟着自带的视频指示，走一遍，就理解了，很容易上手。
9 / 25 宫格分镜生成、一键生成完整故事板、剧情推演四宫格、快速测试不同剧情走向、多机位 9 宫格镜头设计、模拟真实影视机位调度；
还有角色三视图生成、快速建立稳定角色设定、画面时间推演：自动生成前 3 秒 / 后 5 秒画面延展……
各种首创的功能和组合，都在画布里，满足专业视频创作的复杂需求。
第二个，是给Agent准备了一个Skill入口。
那些正在快速进化的个人AI助手，比如小龙虾，可以通过Skill接口直接调用LibTV的创作能力。用Agent的协同，完成从剧本到成片的全部工作。

都说26年的产品要Not for Human, for Agent，但LibTV说，我全都要。
这个设计思路很有意思。
过去二十年，软件产品的成长路径几乎都是同一条：
先做一个好用的界面，把用户圈进来，做到足够大以后再开放API，让开发者来做集成。GUI是正门，API是后门。
但Agent的出现打破了这个先后顺序。
当软件的调用者不再只是人类，而是同时包括成千上万个Agent的时候，API不再是长大以后才需要考虑的事。
它从第一天起就和GUI同等重要。
LibTV，是视频创作领域，第一个从Day1就把人和Agent当作两个平等用户来设计的产品。
丰富的功能，也让创作者不再只是生成单个画面，开始能真正组织一整套视频创作流程、完成一支完整的视频作品。
事情变得更有趣了。
02怎么玩：从无限画布说起
打开LibTV，开始创作，首先看到的就是画布，乍一看很简洁。
但当开始在上面有点击的动作，就会发现藏了很多后手。
无限画布上，有4大功能模块：
「项目菜单栏」「画布左侧栏」「个人中心」和「小地图导航」。

在项目菜单栏里，一个无限画布就是一个项目，点击画布左上角的 Logo 会弹出「项目菜单栏」可以对项目进行管理。
画布左侧栏，设有「添加」「工作流」「资产」「历史记录」「教程」5大功能。
画布右上角，是用户相关功能，包括「发布&分享」「通知」「会员中心」「积分消耗」「个人中心」。
左下角的小地图导航，我尤其喜欢，跟打游戏看地图一样。
然后关键的来了，一个最核心的构成要素：节点。
画布上，有五种基础节点：文本节点、图片节点、视频节点、音频节点、脚本节点。

先带大家看看文本节点。
通过集成了多个语言模型的文本生成器，可以输入自然语言需求或结构化提示词，让语言模型完成对应的文本生成任务。
生成的结果，会展示在「文本节点框」中。
相当于是说，5种不同模态的生成能力，在LibTV里可以自由控制，用节点进行连接和组合。
再也不用先产出文字脚本、再生图、再配乐、然后图生视频等等，不用切换网页、存来存去的，在一个画布里，把完整视频该有的步骤全搞定。

五种节点，让我想起了曾经玩ComfyUI的日子，connecting the dots真的很有趣。
而现在的LibTV，就更容易上手、更好玩了，逻辑上似乎和从Stable Diffusion到Liblib的迁移如出一辙。
让我觉得厉害的，还有工作流功能。
所有节点之间都可以连线，搭建出一条能反复跑的创作流水线。
比如我调出了一条比较顺手的流程：参考生图→图转视频→高清增强。
我把这套流程存成了资产，以后做类似项目的时候，打开画布、换一批输入，就能复用整套流程，不用每次都从零开始。
下面就是一个简单的「参考生图→图转视频」工作流，带大家感受一下。
工作流创建好以后，就像这样

LibTV还塞进去一堆很实用的预制功能。
多机位九宫格、剧情推演四宫格、25宫格连贯分镜、角色三视图、画面推演前后几秒……
这些都是输入指令就能直接调用的魔法。
不用自己设计工作流，只要选中素材、触发指令，它就帮你生成一整块结构化内容。

03再说说Agent
前面的部分似乎还是workflow的范畴，属于视频流程的AI化改造。
但从Agent开始，事情又不一样了。
这个部分更科幻。
我在龙虾对话框里输入了一句话：给我的耳机做一个宣传片，风格参考这个视频链接。
然后把一个参考视频的URL扔了进去。

接下来发生的事情让我有点恍惚。
我的Agent自己去LibTV调用了复刻TVC Skill，自动解析原片的镜头语言和风格，生成剧本，设计分镜，调用模型生成视频片段，最后剪辑成片。
整个过程我没插手一下，它就给我交出了一条30秒的宣传片。

录屏里能看到，Agent在后台自己搭建节点、连接工作流、调整参数，像一个看不见的实习生在那儿埋头干活。
虽然生成的时间有点长，毕竟要跑好几个模型，但最后出来的成片质量，说实话，比我手动做的第一条还要好。
我还试了另一个Skill：短漫剧生成。
输入创意描述，Agent自动完成了剧本、角色设计、分镜、视频、音效、剪辑，给我交付了一部完整的2分钟短剧。
主题是《坠入深海》，讲了一个挺有意思的惊悚寓言。效果就不错下面

这种感觉很奇妙。以前是我指挥工具，现在是我跟Agent协作。
我负责给方向和审美判断，它负责执行和扩展。创作这件事，第一次有了交响的感觉。
04为什么我觉得LibTV不一样
用下来，有几个点让我觉得这产品确实想清楚了。
第一，它真的懂创作者需要什么。
LibTV目前上线了20多个专业视频创作功能，其中好几项是行业首次推出。9/25宫格分镜生成、一键生成完整故事板、剧情推演四宫格、多机位9宫格镜头设计、角色三视图生成、画面时间推演……
这些功能不是拍脑袋想出来的，一定是跟大量创作者聊过之后才知道他们真正缺什么。
我以前做分镜，最烦的就是一张一张生图然后手动拼板。

现在一键生成，省下的时间可以用来琢磨镜头语言本身。我以前调整角色设定，最烦的是换一个角度就得重新抽卡。现在角色三视图生成，一张图搞定正面侧面背面，人物设定稳定多了。
这些细节说明产品经理是真下场做过活的。
第二，它在定价上狠起来连自己都砍。
之前抽卡，有的产品，抽一张两块，抽一百张两百块，做个几分钟的视频下来，成本轻松破千。
LibTV的定价我看了一下数据：年卡最低39折，部分模型还有额外6折优惠，会员SKU价格比竞品低76%，模型积分定价比竞品低92%。换算下来，相当于你用两折多的成本，就能跑出同样的作品。
现在开会员，还会给订阅用户赠送最多150条可灵O3+150条可灵3.0，共300条免费最高等级的视频，任意使用。
价格屠夫这个词用在这里一点不夸张。
第三，它押注了一个正在发生的变化。
AI的能力正在经历第三次跃迁。第一次是学会对话，第二次是学会调用工具，第三次是学会理解复杂任务、自主编排工作流、在项目级上下文中持续迭代。
正是这第三次跃迁，让传统的软件产品必须做出改变。
Agent已经成熟到可以作为独立的创作主体参与工作，它需要的不再是一个API，而是一个为它设计的、任务级的能力入口。
LibTV为Agent设计了Skill入口，让Agent可以像人一样理解任务、调用能力、完成创作。
随着社区的丰富，你的Agent可以在LibTV上执行越来越复杂、越来越贴合你审美的创作任务。

这也是在为即将开启的Agent to Agent时代做准备。
05关于Agent、命令行、审美
更深一层想，LibTV想做的其实不是工具，而是一种新的创作结构。
命令行也许更适合效率类的工具，但是文艺创作的价值，恰恰在于人本身的参与。
一部电影之所以好看，不是因为画面技术上完美无缺，而是因为某个镜头里，有一个只有这个导演才会做出的选择。
我始终相信一件事：真正决定作品高度的，永远是人的判断与审美。
AI可以帮你生成一万个镜头，但只有你知道哪一个镜头是对的。Agent可以替你完成整个制作流程，但只有你知道这个故事想表达什么。
而LibTV的节点、工作流、Agentic Skills……让审美变成了可执行、可流通、可积累的东西。
人在创作，Agent在学习，社区在流转，工具在进化。四件事同时发生，没有先后，没有边界。
到最后会发现，它成了一台驱动审美的引擎——越来越高质量的作品，自然地从系统里长了出来。

LibTV让我看到了一种可能性：当工具足够强大，当Agent足够聪明，创作者终于可以把精力从繁琐的执行中解放出来，去思考那些真正重要的问题——
我想讲一个什么故事？我想让观众感受到什么？这个镜头为什么要这么拍？
这些问题，AI回答不了。但它们才是一切创作的原点。

从国内导演圈、制作圈到好莱坞，普遍有种对AI来临的恐慌和焦虑。
但在我看来，像LibTV这样的产品，已经事实上
不妨试一试：https://www.liblib.tv/
如果想研究一下背后的技术原理，GitHub在这里：https://github.com/libtv-labs/libtv-skills
好莱坞导演对AI的恐慌，大概需要LibTV这样的产品来解决

相关推荐