有不少读者问我平时的文章封面图是怎么做的,觉得看起来效果还不错。
其实很简单,我常用的方法有两种,一种是通过我之前介绍过的 Lovart 这类 AI 工具,还有一种就是直接让 OpenClaw 来做。
今天,就主要讲一下如何在 OpenClaw 上养出一只有设计能力的龙虾。
说个前提,就是你已经安装部署好了自己的 OpenClaw,不管是云端还是本地都可以。
如果你还没完成这一步,在这篇文章的最后我会给你发教程入口。
先来看下使用效果。

你可能会好奇,我是怎么让他做出图里带我的封面图的?
其实很简单,直接给他一张参考图,然后把你的需求通过文字描述给他即可。

如果你不想每次都上传参考图或者输入重复的提示词,也可以把这个画图场景固化成一个 Skill。
比如这样。

下一次用的时候,就直接跟他说生成一张公众号封面图即可,他会默认用我的照片作为主角去制作场景图。
这个过程还是挺方便的,相当于我有一个专属 AI 设计师每天来响应我的一句话需求。
相比我以前去其他网站找公众号封面图,这个效率还是提高了很多。
不仅能做带主角的封面图,他还能根据我的需求画线框图,且同样可以训练成一个产品原型图 Skill,包括标注、交互箭头、甚至是逻辑解释等。

此外,让他根据我的需求设计海报也可以。

我是在 OpenClaw 上新建了一个独立 Agent,给他取名「唐小艺」。
我会把做封面图、画线框图、做海报、设计PPT的工作全部做成独立 Skill,需要的时候直接把完整需求提过去就行。
现在我给他接的是 Nano Banana 2 的模型,后面我也准备换到 GPT Image 2。
看了下后台 API 消耗的 Token 价格,算下来一张图片不超过人民币 5 毛钱。

可能有人觉得贵,但对我来说 ROI 就很高。
我花 5 毛钱得到一张满意的图片,单次省下来的时间所能创作的价值会远超这个价格。
假设我过去每天花 10 分钟在找图片做图片上,那一个星期 7 次就是 1 小时左右。
算下来,我每周花不到 4 块钱就多出来一个小时,这可太划算了。
好,接下来我教你们怎么做。
从这里开始,我都假设你已经完成了 OpenClaw 的部署。如果你还没有自己的龙虾,可能需要先看文章最后面的教程。
让龙虾能画图做设计需要满足一个前提,就是你所使用的大模型本身具备画图能力,有些多模态的模型是可以的,但有些不行。
为了出图质量和效果,我会选择 Nano Banana 2 以及 GPT Image 2。
而且,我准备分两种方式来教你们怎么做。一种是在已有的 OpenClaw + 飞书的模式上新增画图能力。
另一种,就是新建一个独立的 Agent 来让他专门负责画图。
先说第一种,也是最简单的。
第一步,拿到 Nano Banana 2 的模型调用 API。
我没有直接去用官方的 API,而是用的模型中转站,好处就是可以在所有模型之间切换,比较灵活自由。
我用的是 Ofox 的中转服务,用了一段时间比较稳定,后台设计也比较直观,体验是可以的。
如果你们想用 Claude 或者 GPT 这些模型的,在里面也能看到,去这里先注册个账号即可:https://ofox.ai/x/tangren
注册成功之后,你会得到一个 API Key,这就是你用来调用其他模型的通行证。

注意,得到这个 API Key 之后要自己单独存起来,因为等你关掉第一次创建后的那个对话框之后就看不到了。
如果忘记复制了也没关系,你删掉重新建一个就行。
接下来,把你的 API Key 粘贴到下面这段代码我给你标记上中文的那里,就是「apiKey」后面。
"ofox-gemini": { "baseUrl": "https://api.ofox.ai/gemini", "apiKey": "在这里输入你的APIKEY", "api": "openai-completions", "models": [ { "id": "google/gemini-3-pro-image-preview", "name": "Nano Banana Pro", "input": [ "text", "image" ], "contextWindow": 64000, "maxTokens": 32000 }, { "id": "google/gemini-3.1-flash-image-preview", "name": "Nano Banana 2", "input": [ "text", "image" ], "contextWindow": 64000, "maxTokens": 64000 } ] }
这里我是用 Nano Banana 2 和 Nano Banana Pro 作为案例,如果你们想用 GPT Image 2 的,直接在 Ofox 官网的模型广场里也能看到。

如果用 GPT 来生图的话,上面的代码会有些不同,在Ofox上也都有介绍,实在不会的你就去问 DeepSeek 并开启专家模式。
第二步,让 OpenClaw 新增生图模型配置。
在飞书里和你的 OpenClaw 说这么一段话:「我要新增一个模型配置,你帮我加到openclaw.json配置文件里,配置代码如下」。
把前面那段代码跟在这句话后面即可,注意要用你自己注册好的 API Key 替换红框里的中文。

回车,让你的 OpenClaw 帮你完成新模型的配置。
如果这个过程中出现了什么问题,你都可以通过对话的方式让他解决,如果解决不了的,你就去问 DeepSeek,总之都能搞定。
如果他自己配置成功了,通常需要重启网关生效。最直接的方式就是打开终端窗口运行「openclaw gateway restart」。

至于具体怎么打开终端我就不说了,因为看到这里说明你已经部署过 OpenClaw 了。
确认一下生图模型是不是配好了,可以在飞书里输入以下两个命令。
第一个是查看当前有哪些可用模型,注意看,红框里就是我们前面新增的两个生图模型。
如果进一步想确认里面的两个分别是什么,就继续运行 /models 命令,带上第一个结果里的模型分类名。

可以看到,我们之前配置的两个 Nano Banana 模型就在里面了。
到这一步,我们还不能直接用这个模型去生图,这也是我之前踩过的坑。
我以为切换到生图模型就可以了,结果搞了半天 OpenClaw 说是在生图,实际上他根本没有生成,一直在骗我。
查了半天才知道,原来需要让 OpenClaw 具备一个能生图的 Skill 并结合生图模型才可以。

也不知道我是不是遇到的个例,但我确实是通过这种方式才调通的,如果你们有更简单的方式也可以留言说。
第三步,给 OpenClaw 的 Agent 安装一个生图 Skill。
我是直接让他去帮我找适合生图的 Skill,然后根据他的推荐安装的,名字就是我标红的那个。

安装 Skill 成功之后,还需要把之前的 Ofox 上的 API Key 发给他去配置一下。

注意,在这个过程中也有可能出问题,你们可以选择 Agent 操作能力强一点的模型来完成整个过程,比如 GPT-5.4 或者 Claude Opus 4.6。
遇到问题也没关系,你可以让他自己修复处理,实在搞不定的那就去问 DeepSeek。
我到最后就遇到一个卡点,尝试了很多方法也没搞定,于是就去联系了 Ofox 的技术支持,他给我发了两个链接,告诉我直接丢给 OpenClaw 就行。
结果,还真行了。

如果你们在这个环节也遇到卡点的,可以像我一样把链接丢给他,里面都是一些配置说明信息。
链接是这两个:https://api.ofox.ai/gemini/v1beta/models,https://api.ofox.ai/v1/models
搞定这一步之后,最后测试一下生图是否成功。一般来说,都没啥问题了。

我还特意确认了一下,他生图是用的 Nano Banana 2,但对话用的是 Gemini 3.1 Pro,所以是双模型工作。

因为我是指定用 Nano Banana 2 来生图,所以结合 Skill 用就是这个组合。
通过以上三步,就可以让你的龙虾具备设计能力。
可能有读者会说,看起来好麻烦,直接去用 Lovart 不也一样吗?
的确,不过还得看你是在什么工作流里去运用设计能力。
如果你是专业设计师或者有固定设计工作流的人,Lovart 这样的工具的确更方便。
如果你像我一样是偶尔就只要一张图,那 OpenClaw 的 Agent 模式就更直接,而且是按使用付费。
所以,我现在是搭配起来一起用。
大画布多流程设计需求的用 Lovart,比如做产品设计或者品牌物料设计。简单需求的就用 Agent,比如做个封面图或者文章示意图。
今天就先讲已有 Agent 的配置方式了,关于如何在 OpenClaw 里新建独立 Agent 来负责专门工作,之后再给你们出教程。
我现在其实就是多 Agent 并行,也就是我的 AI 团队分工是比较明确的。
这样有一个好处,就是各自干各自的,上下文不干扰,而且可以组合成工作流一起用。

我在 AI 个体户计划的线下训练营里也会跟大家讲多 Agent 的配置以及如何把工
前写的教程:
我这还是一两个月前的教程了,现在的过程比这个更简单,但流程是类似的。
今天就写到这了,赶紧去升级你们的 AI 工作流吧。
我们不会被 AI 淘汰,我们只会被他升级。
关键是,得动手。
核心是,去做事!
················· 唐韧出品 ·················
安可时刻
说个现实。
但凡你装过任意一个 Agent,基本上就已经打开了 AI 世界的大门。
比如,你装好了 OpenClaw,那你就可以让 OpenClaw 去装 Hermes。我之前还写过一篇教程:
同理,如果你装好了 Codex 或者 Claude Code,他们也可以基于你的一句话需求帮你装 OpenClaw 或 Hermes。
这些都是 Agent 框架,能力和特性有所不同,但大致逻辑是类似的,都是成为你的生产力工具。
所以,如果你现在还没有一个属于自己的 Agent,我觉得该改变了。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/282770.html