NanoBanana PPT Skills 项目总结

NanoBanana PPT Skills 项目总结TL DR NanoBanana PPT Skills 是一款基于 AI 自动生成高质量 PPT 图片和视频的工具 支持 Gemini 图像生成 可灵 AI 转场视频 FFmpeg 合成 可输出 2K 4K 分辨率的交互式 PPT 内置两种视觉风格 渐变毛玻璃卡片 矢量插画 适合科技产品发布 商务演示 教育培训等场景 作者 钰玟 项目总结时间 2026 年 3 月 23 日 项目名称

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



TL;DR: NanoBanana PPT Skills 是一款基于 AI 自动生成高质量 PPT 图片和视频的工具,支持 Gemini 图像生成、可灵 AI 转场视频、FFmpeg 合成,可输出 2K/4K 分辨率的交互式 PPT。内置两种视觉风格(渐变毛玻璃卡片、矢量插画),适合科技产品发布、商务演示、教育培训等场景。

作者:钰玟|项目总结时间:2026 年 3 月 23 日


项目名称: NanoBanana PPT Skills GitHub 仓库: https://github.com/op7418/NanoBanana-PPT-Skills 创作者: 歸藏 (@op7418) 许可证: MIT License

基于 AI 自动生成高质量 PPT 图片和视频的工具,支持智能转场和交互式播放。


  • 自动提取核心要点,规划 PPT 内容结构
  • 支持封面页、内容页、数据页自动识别
  • 使用 Google Nano Banana Pro (Gemini 3 Pro Image Preview)
  • 高质量 16:9 比例,2K/4K 分辨率可选
  • 生成速度:2K 约 30 秒/页
  • 集成可灵 AI API 创建流畅的页面过渡动画
  • 自动生成首页循环预览视频
  • 智能生成页面间的过渡视频
  • 视频与图片混合播放
  • 支持键盘控制(方向键、空格、ESC 等)
  • 智能转场和循环预览
  • 使用 FFmpeg 合成包含所有转场的完整 PPT 视频
  • 自动统一分辨率和帧率
  • 高质量 H.264 编码
  • 自动识别封面页、内容页、数据页
  • 多风格模板支持

视觉特点:

  • Apple Keynote 极简主义
  • 玻璃拟态效果
  • 霓虹紫/电光蓝/珊瑚橙渐变
  • 3D 玻璃物体 + 电影级光照

适用场景:

  • 科技产品发布
  • 商务演示
  • 数据报告
  • 企业品牌展示

视觉特点:

  • 温暖扁平化设计
  • 复古柔和配色
  • 统一黑色轮廓线
  • 几何化简化处理
  • 玩具模型般的可爱感

适用场景:

  • 教育培训
  • 创意提案
  • 儿童相关内容
  • 温暖品牌故事

技术 用途 Google Nano Banana Pro Gemini 3 Pro Image Preview - 图像生成 可灵 AI API 视频生成、数字人、主体库 FFmpeg 视频合成与参数统一 Python 主要开发语言 HTML5 交互式播放器前端
  • google-genai - Google AI API 封装
  • pillow - 图像处理
  • python-dotenv - 环境变量管理

复制以下提示词发送给 Claude Code:

请帮我安装 NanoBanana PPT Skills: 1. 克隆项目并进入目录: git clone https://github.com/op7418/NanoBanana-PPT-Skills.git cd NanoBanana-PPT-Skills 2. 创建 Python 虚拟环境: python3 -m venv venv source venv/bin/activate # Windows: venvScriptsactivate 3. 安装依赖: pip install google-genai pillow python-dotenv 4. 配置 API 密钥 - 创建 .env 文件: cp .env.example .env 5. 编辑 .env 文件,填入我的 API 密钥: GEMINI_API_KEY=YOUR_GEMINI_API_KEY KLING_ACCESS_KEY=YOUR_KLING_ACCESS_KEY KLING_SECRET_KEY=YOUR_KLING_SECRET_KEY 6. 验证安装: python3 generate_ppt.py --help 
请帮我将 NanoBanana PPT Skills 安装为 Claude Code Skill: 1. 创建 Skill 目录: mkdir -p ~/.claude/skills/ppt-generator 2. 克隆项目到 Skill 目录: git clone https://github.com/op7418/NanoBanana-PPT-Skills.git ~/.claude/skills/ppt-generator 3. 进入目录并安装依赖: cd ~/.claude/skills/ppt-generator python3 -m venv venv source venv/bin/activate pip install google-genai pillow python-dotenv 4. 配置 API 密钥: cp .env.example .env # 然后编辑 .env 文件,填入你的 API 密钥 5. 验证安装: python3 generate_ppt.py --help 
# 克隆项目 git clone https://github.com/op7418/NanoBanana-PPT-Skills.git cd NanoBanana-PPT-Skills # 创建虚拟环境 python3 -m venv venv source venv/bin/activate # Windows: venvScriptsactivate # 安装依赖 pip install google-genai pillow python-dotenv # 配置 API 密钥 cp .env.example .env nano .env # 填入你的 API 密钥 

GEMINI_API_KEY(Google AI API)

  • 获取地址:https://aistudio.google.com/apikey
  • 用于:生成 PPT 图片

KLING_ACCESS_KEY + KLING_SECRET_KEY(可灵 AI)

  • 获取地址:https://klingai.com
  • 用于:生成转场视频功能
  • 注意:如只需生成图片,此密钥非必需

python3 generate_ppt.py --plan my_slides_plan.json --style styles/gradient-glass.md --resolution 2K 

参数说明:

  • --plan:幻灯片计划 JSON 文件
  • --style:风格文件路径
  • --resolution:分辨率(2K 或 4K)
{ "title": "AI 产品设计指南", "total_slides": 5, "slides": [ { "slide_number": 1, "page_type": "cover", "content": "标题:AI 产品设计指南 副标题:构建以用户为中心的智能体验" }, { "slide_number": 2, "page_type": "content", "content": "核心原则 - 简单直观 - 快速响应 - 透明可控" }, { "slide_number": 3, "page_type": "content", "content": "设计流程 1. 用户研究 2. 原型设计 3. 测试迭代" }, { "slide_number": 4, "page_type": "data", "content": "用户满意度 使用前:65% 使用后:92% 提升:+27%" }, { "slide_number": 5, "page_type": "content", "content": "总结 - 以用户为中心 - 持续优化迭代 - 数据驱动决策" } ] } 
# 1. 生成转场提示词 python3 generate_ppt_video.py --slides-dir outputs/TIMESTAMP/images --output-dir outputs/TIMESTAMP_video --prompts-file outputs/TIMESTAMP/transition_prompts.json # 2. 直接生成转场视频 python3 generate_ppt_video.py --slides-dir outputs/_/images --output-dir outputs/_video --mode professional --duration 5 

参数说明:

  • --slides-dir:PPT 图片目录
  • --output-dir:输出目录
  • --mode:转场模式(professional 或 creative)
  • --duration:转场视频时长(秒,默认 5)
# 查看图片播放器
open outputs/TIMESTAMP/index.html

# 查看视频播放器
open outputs/TIMESTAMP_video/video_index.html

# 查看完整视频
open outputs/TIMESTAMP_video/full_ppt_video.mp4

功能 快捷键 说明 下一页 → ↓ 播放转场视频,然后显示下一页 上一页 ← ↑ 返回上一页(直接显示) 首页 Home 返回首页预览 末页 End 跳到最后一页 播放/暂停 空格 暂停/继续当前视频 全屏 ESC 切换全屏模式 隐藏控件 H 隐藏/显示控制提示

ppt-generator/
├── README.md                          # 项目说明文档
├── API_MANAGEMENT.md                  # API 密钥管理指南
├── ENV_SETUP.md                       # 环境变量配置指南
├── SECURITY.md                        # 安全**实践
├── .env.example                       # 环境变量模板
├── .env                               # 实际环境变量 (不提交到 Git)
├── .gitignore                         # Git 忽略规则
│
├── generate_ppt.py                    # PPT 图片生成脚本
├── generate_ppt_video.py              # 视频生成主脚本
├── kling_api.py                       # 可灵 AI API 封装
├── video_composer.py                  # FFmpeg 视频合成
├── video_materials.py                 # 视频素材管理
├── transition_prompt_generator.py      # 转场提示词生成器
│
├── styles/                            # 风格库
│   ├── gradient-glass.md              # 渐变毛玻璃卡片风格
│   └── vector-illustration.md          # 矢量插画风格
│
├── templates/                         # HTML 模板
│   ├── viewer.html                    # 图片播放器
│   └── video_viewer.html              # 视频播放器
│
├── prompts/                           # 提示词模板
│   └── transition_base.md             # 转场提示词基础模板
│
└── outputs/                           # 生成结果 (自动创建)
    ├── TIMESTAMP/                     # 图片版本
    │   ├── images/                    # PPT 图片
    │   ├── index.html                 # 图片播放器
    │   └── prompts.json               # 生成提示词记录
    └── TIMESTAMP_video/               # 视频版本
        ├── videos/                    # 转场视频
        ├── video_index.html           # 视频播放器
        └── full_ppt_video.mp4         # 完整视频

分辨率 尺寸 文件大小 生成速度 推荐场景 2K 2752x1536 ~2.5MB/页 ~30秒/页 日常演示、在线分享 4K 5504x3072 ~8MB/页 ~60秒/页 打印输出、大屏展示
参数 默认值 说明 分辨率 1920x1080 统一为 1080p 帧率 24fps 统一帧率,确保流畅拼接 静态图片时长 2秒 每页停留时间 转场视频时长 5秒 可灵生成的转场时长
页数范围 演讲时长 适用场景 5 页 5 分钟 电梯演讲、快速介绍 5-10 页 10-15 分钟 标准演示、产品介绍 10-15 页 20-30 分钟 深入讲解、培训课程 20-25 页 45-60 分钟 完整培训、研讨会

# 使用 .env 文件管理密钥 cp .env.example .env # 编辑 .env 填入真实密钥 
# 永远不要在代码中硬编码密钥! GEMINI_API_KEY = "AIzaSy..." 

# 验证没有密钥泄露 grep -r “AIzaSy|ak-” –exclude-dir=.git –exclude-dir=venv .

检查 .env 文件是否被排除

git status # 确认 .env 不在待提交列表中


Q: 必须要有可灵 AI 密钥吗? A: 不是必须的。只生成 PPT 图片只需要 GEMINI_API_KEY;生成转场视频需要可灵 AI 密钥。

Q: 如何导出为 PDF? A: 在浏览器中打开 index.html,按 Cmd+P (Mac) 或 Ctrl+P (Windows),选择”另存为 PDF”。

Q: 视频生成失败怎么办? A: 检查以下几点:

  • FFmpeg 是否已安装(ffmpeg -version
  • 视频文件是否存在且完整
  • 磁盘空间是否充足
  • 查看详细错误信息

Q: 如何修改静态图片展示时长? A: 在 video_composer.py 中修改 slide_duration 参数(默认 2 秒)。

Q: 可灵视频生成太慢怎么办? A: 可以灵 AI 生成视频需要一定时间(通常 30-60 秒/段)。可以:

  • 减少转场数量
  • 使用较短的转场时长
  • 分批生成

创建自定义风格:

  1. styles/ 目录创建新的 .md 文件
  2. 按照模板编写风格定义(参考现有风格)
  3. 直接使用新风格生成 PPT

  • 可灵 AI 转场视频生成
  • 交互式视频播放器(视频+图片混合)
  • FFmpeg 完整视频合成
  • 首页循环预览视频
  • 自动统一分辨率和帧率
  • 修复视频拼接兼容性问题
  • 静态图片展示时间改为 2 秒
  • 修复预览模式状态管理问题
  • 修复 FFmpeg 滤镜参数格式错误

  • 内置 2 种专业风格
  • 支持 2K/4K 分辨率
  • HTML5 图片播放器
  • 智能文档分析
  • 安全的环境变量管理

  • Google Gemini Team - 提供强大的 Nano Banana Pro 图像生成模型
  • 可灵 AI 团队 - 提供高质量的视频生成服务
  • FFmpeg 项目 - 提供强大的视频处理工具
  • 开源社区 - 提供的各种工具和灵感

  • GitHub 仓库: https://github.com/op7418/NanoBanana-PPT-Skills
  • Issues 反馈: https://github.com/op7418/NanoBanana-PPT-Skills/issues
  • Google AI Studio: https://aistudio.google.com/apikey
  • 可灵 AI 平台: https://klingai.com

MIT License - 详见项目文件

小讯
上一篇 2026-03-27 23:21
下一篇 2026-03-27 23:19

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/248138.html