TL;DR: NanoBanana PPT Skills 是一款基于 AI 自动生成高质量 PPT 图片和视频的工具,支持 Gemini 图像生成、可灵 AI 转场视频、FFmpeg 合成,可输出 2K/4K 分辨率的交互式 PPT。内置两种视觉风格(渐变毛玻璃卡片、矢量插画),适合科技产品发布、商务演示、教育培训等场景。
作者:钰玟|项目总结时间:2026 年 3 月 23 日
项目名称: NanoBanana PPT Skills GitHub 仓库: https://github.com/op7418/NanoBanana-PPT-Skills 创作者: 歸藏 (@op7418) 许可证: MIT License
基于 AI 自动生成高质量 PPT 图片和视频的工具,支持智能转场和交互式播放。
- 自动提取核心要点,规划 PPT 内容结构
- 支持封面页、内容页、数据页自动识别
- 使用 Google Nano Banana Pro (Gemini 3 Pro Image Preview)
- 高质量 16:9 比例,2K/4K 分辨率可选
- 生成速度:2K 约 30 秒/页
- 集成可灵 AI API 创建流畅的页面过渡动画
- 自动生成首页循环预览视频
- 智能生成页面间的过渡视频
- 视频与图片混合播放
- 支持键盘控制(方向键、空格、ESC 等)
- 智能转场和循环预览
- 使用 FFmpeg 合成包含所有转场的完整 PPT 视频
- 自动统一分辨率和帧率
- 高质量 H.264 编码
- 自动识别封面页、内容页、数据页
- 多风格模板支持
视觉特点:
- Apple Keynote 极简主义
- 玻璃拟态效果
- 霓虹紫/电光蓝/珊瑚橙渐变
- 3D 玻璃物体 + 电影级光照
适用场景:
- 科技产品发布
- 商务演示
- 数据报告
- 企业品牌展示
视觉特点:
- 温暖扁平化设计
- 复古柔和配色
- 统一黑色轮廓线
- 几何化简化处理
- 玩具模型般的可爱感
适用场景:
- 教育培训
- 创意提案
- 儿童相关内容
- 温暖品牌故事
google-genai- Google AI API 封装pillow- 图像处理python-dotenv- 环境变量管理
复制以下提示词发送给 Claude Code:
请帮我安装 NanoBanana PPT Skills: 1. 克隆项目并进入目录: git clone https://github.com/op7418/NanoBanana-PPT-Skills.git cd NanoBanana-PPT-Skills 2. 创建 Python 虚拟环境: python3 -m venv venv source venv/bin/activate # Windows: venvScriptsactivate 3. 安装依赖: pip install google-genai pillow python-dotenv 4. 配置 API 密钥 - 创建 .env 文件: cp .env.example .env 5. 编辑 .env 文件,填入我的 API 密钥: GEMINI_API_KEY=YOUR_GEMINI_API_KEY KLING_ACCESS_KEY=YOUR_KLING_ACCESS_KEY KLING_SECRET_KEY=YOUR_KLING_SECRET_KEY 6. 验证安装: python3 generate_ppt.py --help
请帮我将 NanoBanana PPT Skills 安装为 Claude Code Skill: 1. 创建 Skill 目录: mkdir -p ~/.claude/skills/ppt-generator 2. 克隆项目到 Skill 目录: git clone https://github.com/op7418/NanoBanana-PPT-Skills.git ~/.claude/skills/ppt-generator 3. 进入目录并安装依赖: cd ~/.claude/skills/ppt-generator python3 -m venv venv source venv/bin/activate pip install google-genai pillow python-dotenv 4. 配置 API 密钥: cp .env.example .env # 然后编辑 .env 文件,填入你的 API 密钥 5. 验证安装: python3 generate_ppt.py --help
# 克隆项目 git clone https://github.com/op7418/NanoBanana-PPT-Skills.git cd NanoBanana-PPT-Skills # 创建虚拟环境 python3 -m venv venv source venv/bin/activate # Windows: venvScriptsactivate # 安装依赖 pip install google-genai pillow python-dotenv # 配置 API 密钥 cp .env.example .env nano .env # 填入你的 API 密钥
GEMINI_API_KEY(Google AI API)
- 获取地址:https://aistudio.google.com/apikey
- 用于:生成 PPT 图片
KLING_ACCESS_KEY + KLING_SECRET_KEY(可灵 AI)
- 获取地址:https://klingai.com
- 用于:生成转场视频功能
- 注意:如只需生成图片,此密钥非必需
python3 generate_ppt.py --plan my_slides_plan.json --style styles/gradient-glass.md --resolution 2K
参数说明:
--plan:幻灯片计划 JSON 文件--style:风格文件路径--resolution:分辨率(2K 或 4K)
{ "title": "AI 产品设计指南", "total_slides": 5, "slides": [ { "slide_number": 1, "page_type": "cover", "content": "标题:AI 产品设计指南 副标题:构建以用户为中心的智能体验" }, { "slide_number": 2, "page_type": "content", "content": "核心原则 - 简单直观 - 快速响应 - 透明可控" }, { "slide_number": 3, "page_type": "content", "content": "设计流程 1. 用户研究 2. 原型设计 3. 测试迭代" }, { "slide_number": 4, "page_type": "data", "content": "用户满意度 使用前:65% 使用后:92% 提升:+27%" }, { "slide_number": 5, "page_type": "content", "content": "总结 - 以用户为中心 - 持续优化迭代 - 数据驱动决策" } ] }
# 1. 生成转场提示词 python3 generate_ppt_video.py --slides-dir outputs/TIMESTAMP/images --output-dir outputs/TIMESTAMP_video --prompts-file outputs/TIMESTAMP/transition_prompts.json # 2. 直接生成转场视频 python3 generate_ppt_video.py --slides-dir outputs/_/images --output-dir outputs/_video --mode professional --duration 5
参数说明:
--slides-dir:PPT 图片目录--output-dir:输出目录--mode:转场模式(professional 或 creative)--duration:转场视频时长(秒,默认 5)
# 查看图片播放器
open outputs/TIMESTAMP/index.html
# 查看视频播放器
open outputs/TIMESTAMP_video/video_index.html
# 查看完整视频
open outputs/TIMESTAMP_video/full_ppt_video.mp4
ppt-generator/
├── README.md # 项目说明文档
├── API_MANAGEMENT.md # API 密钥管理指南
├── ENV_SETUP.md # 环境变量配置指南
├── SECURITY.md # 安全**实践
├── .env.example # 环境变量模板
├── .env # 实际环境变量 (不提交到 Git)
├── .gitignore # Git 忽略规则
│
├── generate_ppt.py # PPT 图片生成脚本
├── generate_ppt_video.py # 视频生成主脚本
├── kling_api.py # 可灵 AI API 封装
├── video_composer.py # FFmpeg 视频合成
├── video_materials.py # 视频素材管理
├── transition_prompt_generator.py # 转场提示词生成器
│
├── styles/ # 风格库
│ ├── gradient-glass.md # 渐变毛玻璃卡片风格
│ └── vector-illustration.md # 矢量插画风格
│
├── templates/ # HTML 模板
│ ├── viewer.html # 图片播放器
│ └── video_viewer.html # 视频播放器
│
├── prompts/ # 提示词模板
│ └── transition_base.md # 转场提示词基础模板
│
└── outputs/ # 生成结果 (自动创建)
├── TIMESTAMP/ # 图片版本
│ ├── images/ # PPT 图片
│ ├── index.html # 图片播放器
│ └── prompts.json # 生成提示词记录
└── TIMESTAMP_video/ # 视频版本
├── videos/ # 转场视频
├── video_index.html # 视频播放器
└── full_ppt_video.mp4 # 完整视频
# 使用 .env 文件管理密钥 cp .env.example .env # 编辑 .env 填入真实密钥
# 永远不要在代码中硬编码密钥! GEMINI_API_KEY = "AIzaSy..."
# 验证没有密钥泄露 grep -r “AIzaSy|ak-” –exclude-dir=.git –exclude-dir=venv .
检查 .env 文件是否被排除
git status # 确认 .env 不在待提交列表中
Q: 必须要有可灵 AI 密钥吗? A: 不是必须的。只生成 PPT 图片只需要 GEMINI_API_KEY;生成转场视频需要可灵 AI 密钥。
Q: 如何导出为 PDF? A: 在浏览器中打开 index.html,按 Cmd+P (Mac) 或 Ctrl+P (Windows),选择”另存为 PDF”。
Q: 视频生成失败怎么办? A: 检查以下几点:
- FFmpeg 是否已安装(
ffmpeg -version) - 视频文件是否存在且完整
- 磁盘空间是否充足
- 查看详细错误信息
Q: 如何修改静态图片展示时长? A: 在 video_composer.py 中修改 slide_duration 参数(默认 2 秒)。
Q: 可灵视频生成太慢怎么办? A: 可以灵 AI 生成视频需要一定时间(通常 30-60 秒/段)。可以:
- 减少转场数量
- 使用较短的转场时长
- 分批生成
创建自定义风格:
- 在
styles/目录创建新的.md文件 - 按照模板编写风格定义(参考现有风格)
- 直接使用新风格生成 PPT
- 可灵 AI 转场视频生成
- 交互式视频播放器(视频+图片混合)
- FFmpeg 完整视频合成
- 首页循环预览视频
- 自动统一分辨率和帧率
- 修复视频拼接兼容性问题
- 静态图片展示时间改为 2 秒
- 修复预览模式状态管理问题
- 修复 FFmpeg 滤镜参数格式错误
- 内置 2 种专业风格
- 支持 2K/4K 分辨率
- HTML5 图片播放器
- 智能文档分析
- 安全的环境变量管理
- Google Gemini Team - 提供强大的 Nano Banana Pro 图像生成模型
- 可灵 AI 团队 - 提供高质量的视频生成服务
- FFmpeg 项目 - 提供强大的视频处理工具
- 开源社区 - 提供的各种工具和灵感
- GitHub 仓库: https://github.com/op7418/NanoBanana-PPT-Skills
- Issues 反馈: https://github.com/op7418/NanoBanana-PPT-Skills/issues
- Google AI Studio: https://aistudio.google.com/apikey
- 可灵 AI 平台: https://klingai.com
MIT License - 详见项目文件
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/248138.html