Midjourney／Stable Diffusion 教程：从零开始，教你如何精准写出“咒语“

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

坚持用清晰易懂的图解 + 代码语言，让每个知识点变得简单！
🚀呆头个人主页详情
🌱 呆头个人Gitee代码仓库
📌 呆头详细专栏系列
座右铭： “不患无位，患所以立。”

最近我沉迷上了AI绘画，从一个连火柴人都画不直的码农，摇身一变成了能生成惊艳壁纸的”数字艺术家”。说实话，第一次看到自己用文字描述就能生成一幅精美图像的时候，那种感觉简直像是发现了***！

你可能会问：”呆头，你不是写代码的吗？怎么突然对画画感兴趣了？”嘿嘿，作为一个对所有新技术都充满好奇心的开发者，我发现AI绘画不仅仅是一种创作工具，更是一种新的编程范式——只不过我们用的不是Python或JavaScript，而是自然语言。

在传统编程中，我们通过代码控制计算机；而在AI绘画中，我们通过”咒语”(Prompt)控制AI模型。这个过程同样需要逻辑思维、结构化表达和不断迭代优化，简直就是为我们程序员量身定做的新玩具！

经过几个月的摸索和实验，我总结出了一套”咒语编写框架”，帮助我从生成模糊不清的草图，进化到能创作出令人惊叹的艺术作品。今天，我就把这套方法完整分享给大家，让你即使是零基础，也能快速掌握AI绘画的核心技巧。

无论你是想为自己的项目生成独特的插图，为博客创作吸引眼球的封面，还是纯粹出于兴趣想探索这项新技术，这篇教程都能帮你少走弯路，直达”AI艺术家”的殿堂。准备好了吗？让我们一起开始这段从”文字到图像”的神奇旅程！

在深入学习咒语之前，我们先简单了解一下AI绘画的原理。本质上，AI绘画模型是通过学习海量的图像和对应文本描述，建立起文字与视觉元素之间的关联。当我们输入一段文字描述（即”咒语”）时，AI会尝试生成与这段描述最匹配的图像。

这段代码虽然极度简化，但展示了扩散模型(Diffusion Models)的核心思想：从随机噪声开始，根据文本描述逐步”去噪”，最终形成符合描述的图像。

Midjourney vs. Stable Diffusion：我该如何选？

作为一个尝试过各种AI绘画工具的”技术尝鲜党”，我可以给大家分享一下两大主流工具的对比：

Midjourney

Midjourney是目前市面上最容易上手、出图质量最稳定的AI绘画工具。它运行在Discord平台上，使用起来非常简单：

只需在Discord中输入这样一行命令，几十秒后就能得到四张精美的日落图片。

优点：

艺术感极强，即使是简单提示词也能生成惊艳效果
操作简单，学习曲线平缓
社区活跃，可以从其他用户作品中获取灵感

缺点：

需要付费订阅（基础版每月10美元起）
无法本地部署，依赖网络和服务器状态
自定义程度相对有限

Stable Diffusion

作为一名开发者，我对Stable Diffusion的开源特性格外青睐。它允许你完全掌控生成过程的每个细节：

优点：

完全免费且开源
可本地部署，无需担心隐私问题
自定义性极高，支持各种模型、插件和工作流

缺点：

需要一定的技术背景才能充分利用
对硬件要求较高（推荐至少8GB显存的GPU）
默认效果不如Midjourney惊艳，需要更精细的提示词

“咒语”(Prompt)的本质

无论你选择哪种工具，掌握”咒语”的编写都是成功的关键。咒语不仅仅是简单的文字描述，而是一套结构化的指令系统，告诉AI你想要什么，不想要什么，以及如何表现这些元素。

图1：AI绘画工作流程图 – flowchart – 展示从咒语输入到最终图像生成的迭代过程

#、# 第二部分：咒语的核心语法——四段式黄金公式

经过数百次实验和对比，我总结出了一套”四段式黄金公式”，这个公式适用于几乎所有AI绘画场景，无论是Midjourney还是Stable Diffusion：

让我们详细解析每个部分：

1. 主体(Subject)

主体是你想要绘制的核心对象，是画面的焦点。描述主体时，应尽可能具体，包括外观、姿态、表情、服装等细节。

示例：

基础版：
进阶版：

2. 环境(Environment)

环境描述了主体所处的场景、背景、时间、天气等元素，为画面提供上下文和氛围。

示例：

基础版：
进阶版：

3. 风格(Style)

风格定义了整个画面的艺术表现形式，可以是特定艺术流派、艺术家风格、媒介类型或视觉效果。

示例：

基础版：
进阶版：

4. 构图(Composition)

构图指定了画面的技术参数，如视角、光照、景深、分辨率等，这些元素决定了画面的专业质感。

示例：

基础版：
进阶版：

将这四个部分组合起来，我们就得到了一个完整的咒语：

这个咒语已经足够详细，能够指导AI生成一幅具有明确主题、环境、风格和构图的精美图像。

图2：咒语结构思维导图 – mindmap – 展示四段式黄金公式的各个组成部分及其细分要素

理论讲完了，现在让我们通过一个实际案例，看看如何一步步优化咒语，从简单描述到精美艺术作品。

最基础的咒语往往只包含简单的主体描述：

这样的咒语过于简单，AI没有足够的信息来理解你的意图，生成的图像往往平淡无奇，缺乏特色和细节。

让我们丰富主体描述，并添加环境信息：

这个咒语已经大大改善，AI现在知道了女孩的外貌特征、服装，以及她所处的具体环境。生成的图像会更加具体和有趣。

接下来，我们添加风格信息，让图像具有特定的艺术表现形式：

通过指定”anime style”和”by Makoto Shinkai”，我们告诉AI模仿新海诚的动画风格。”digital art”和”vibrant colors”进一步定义了媒介类型和色彩特点。

最后，我们添加构图和技术参数，提升图像的专业质感：

这个最终版本的咒语涵盖了四段式公式的所有要素，能够指导AI生成一幅具有明确视觉风格、专业光影效果和高清细节的精美图像。

图3：咒语优化流程时序图 – sequenceDiagram – 展示从简单到复杂的咒语迭代过程及其效果变化

掌握了基本框架后，让我们探索一些进阶技巧，这些小窍门能让你的AI作品更上一层楼。

有一些特殊的”魔法词缀”，能够显著提升画面的整体质感。这些词汇已经被AI模型强烈关联到高质量图像，因此在咒语中添加它们通常会带来积极效果：

这些词缀可以根据需要添加到咒语的末尾，但不要过度使用，否则可能导致AI过度关注某些特定风格而忽略你的主要意图。

在Stable Diffusion中，你可以使用负向提示词告诉AI”不要生成什么”。这在排除常见缺陷时特别有用：

这段负向提示词告诉AI避免生成模糊、低质量的图像，以及常见的解剖错误（如畸形的手、多余的手指等）。

在Midjourney中，你可以使用参数实现类似效果：

Midjourney参数

Midjourney提供了多种参数来控制生成过程：

这里：

设置宽高比为16:9（适合壁纸）
使用Midjourney第5版模型
设置质量等级（范围1-5，越高越精细但生成时间更长）
设置风格化程度（范围0-1000）

Stable Diffusion参数

Stable Diffusion则提供了更多技术参数：

这些参数让你能够精确控制生成过程的每个细节，是从入门到精通的必经之路。

图4：AI绘画质量影响因素占比 – pie – 展示不同因素对最终图像质量的影响程度

工具对比：选择适合你的AI绘画平台

特性 Midjourney Stable Diffusion DALL-E 2 Firefly 易用性 ★★★★★ ★★★ ★★★★★ ★★★★ 自定义程度 ★★★ ★★★★★ ★★ ★★★ 艺术效果 ★★★★★ ★★★★ ★★★ ★★★★ 价格订阅制($10-30/月) 免费(开源) 按积分付费订阅制(Creative Cloud) 本地部署 ❌ ✅ ❌ ❌ 社区支持 ★★★★★ ★★★★★ ★★★ ★★ 适合人群 艺术家、设计师、内容创作者开发者、技术爱好者、隐私关注者商业用户、快速原型设计 Adobe生态系统用户

实用技巧：提升成功率的小窍门

使用英文编写咒语：虽然AI模型支持多语言，但英文训练数据最丰富，通常能获得更好的结果。
使用逗号分隔元素：在咒语中使用逗号分隔不同元素，这样AI更容易理解每个部分的含义。
保存有效的种子值：在Stable Diffusion中，如果生成了一张满意的图像，记录下使用的种子值，这样你可以在保持相同主体的同时微调其他元素。
使用权重调整：在Stable Diffusion中，你可以使用括号调整关键词的权重：
这里，”cyberpunk”的权重为1.5，”neon lights”为1.2，”flying cars”为0.8。
参考艺术家组合：结合多位艺术家的风格可以创造独特效果：

图5：AI绘画模型性能对比 – xychart-beta – 展示不同AI绘画模型在各个维度上的表现评分

“AI不是来取代艺术家的，而是给每个人提供了成为艺术家的可能性。”

经过这篇教程的学习，你已经掌握了AI绘画的核心技巧——“四段式黄金公式”：主体 + 环境 + 风格 + 构图。这个框架适用于所有主流AI绘画工具，能帮助你系统性地构建高质量咒语。

作为一个从零基础开始探索AI绘画的程序员，我深刻体会到这项技术的魅力不仅在于它能生成美丽的图像，更在于它打破了传统创作的门槛，让每个人都能表达自己的创意想法。就像编程一样，AI绘画也是一门需要不断实践和迭代的技艺，你写的每一个咒语，都是一次创意的表达和技术的实践。

我还记得自己第一次成功生成一张满意作品时的兴奋——那是一张赛博朋克风格的城市夜景，霓虹灯在雨中闪烁，反射在湿漉漉的街道上。那一刻，我感受到了技术与艺术融合的力量，也明白了为什么越来越多的开发者开始关注这个领域。

AI绘画不仅仅是一个有趣的工具，它正在改变我们创作和表达的方式。作为开发者，我们有幸站在这场变革的前沿，不仅能够使用这些工具，还能参与构建它们的未来。

如果你对AI绘画感兴趣，我强烈建议你从今天开始尝试。不要害怕犯错，每一个”失败”的生成都是学习的机会。记住，最重要的不是技术本身，而是你想要表达的创意和想法。

最后，分享几个寻找灵感和学习的社区：

Midjourney官方Discord社区
r/StableDiffusion Reddit社区
Civitai.com（Stable Diffusion模型和提示词分享平台）
Lexica.art（AI艺术搜索引擎）

希望这篇教程能帮助你开启AI绘画的奇妙旅程。如果你有任何问题或想法，欢迎在评论区留言讨论！

图6：AI绘画工具选择矩阵 – quadrantChart – 基于易用性和自定义程度的AI绘画工具定位图

作为一个从代码世界跳入AI艺术领域的开发者，这段旅程让我重新思考了创造力的本质。在过去的几个月里，我用AI绘画工具创作了超过500张图像，从最初的模糊不清到现在能精准表达我的创意，每一步都充满了惊喜和发现。

最让我惊讶的是，编程思维在AI绘画中竟然如此有用——结构化思考、模块化设计、迭代优化，这些软件开发的核心理念同样适用于构建高质量的”咒语”。就像重构代码一样，我们可以不断优化提示词，直到得到理想的结果。

AI绘画也让我重新审视了人类创造力的价值。在这个工具日益强大的时代，真正珍贵的不是绘画技巧本身，而是创意构思、审美判断和情感表达的能力。AI是画笔，而我们仍然是决定画什么、如何画的艺术家。

我希望这篇教程不仅能帮你掌握技术细节，更能激发你的创造热情。无论你是想为自己的项目生成独特插图，还是纯粹出于兴趣探索这项新技术，记住：最好的学习方式就是动手实践。

参考链接

Midjourney官方指南
Stable Diffusion WebUI使用手册
Lexica – AI艺术搜索引擎
Civitai – Stable Diffusion模型社区
Prompt Engineering Guide – AI绘画提示词工程指南

关键词标签

#AI绘画 #Midjourney #StableDiffusion #提示词工程 #数字艺术

文章来源于互联网:Midjourney/Stable Diffusion 教程：从零开始，教你如何精准写出“咒语“

Midjourney／Stable Diffusion 教程：从零开始，教你如何精准写出“咒语“

Midjourney vs. Stable Diffusion：我该如何选？

Midjourney

Stable Diffusion

“咒语”(Prompt)的本质

1. 主体(Subject)

2. 环境(Environment)

3. 风格(Style)

4. 构图(Composition)

Midjourney参数

Stable Diffusion参数

工具对比：选择适合你的AI绘画平台

实用技巧：提升成功率的小窍门

参考链接

关键词标签

相关推荐