🎨 VibeCanvas: 基于 Google Gemini 的全链路 AI 创意工作台

🎨 VibeCanvas: 基于 Google Gemini 的全链路 AI 创意工作台

VibeCanvas - 重塑 AI 与创意的边界

项目愿景:VibeCanvas 不仅仅是一个 AI 工具集,它是一个将 Google Gemini 的多模态能力深度解构并重组成行业工作流的创意实验室。通过无限画布、自动化分镜与垂直领域设计,它让”灵感”到”成品”的跨度缩减至秒级。

VibeCanvas 全景预览


🏗️ 三大核心模块:从分镜到定制设计

1. CineScout: 电影级分镜可视化

CineScout 专为导演与编剧设计,能将枯燥的剧本文字瞬间转化为极具视觉冲击力的分镜预演。

  • 多维模式: 支持 Storyboard (纯净写实) 与 **Comic (漫画叙事)**,完美适配不同创作语境。
  • 构图控制: 自由选择 2x2 或 3x3 布局,支持多种画幅比例定制。
  • 一致性表现: 基于 Gemini 强大的语义理解,确保场景与角色在多格分镜间的高度连贯。
纯画面模式 漫画分镜模式
纯画面模式预览 漫画分镜模式预览

分镜输出案例
分镜结果图


2. Infinite Canvas: 触手可及的无限创意

打破传统画布的限制,Infinite Canvas 提供了一个可以无限延展的交互空间。

  • 交互式生成: 随处点击,随处生成,支持基于已有内容进行局部重绘与风格扩展。
  • 模特一致性展示: 特别优化的模特生成算法,展现出媲美时尚大片的写实度与细节把控。

无限画布展示
模特多角度输出


3. Jewelry Studio: 材质与光影的艺术

针对珠宝行业深度定制,通过精准的 Prompt 工程捕捉金属质感与宝石折射。

  • 极度写实: 无论是黄金的色泽还是钻石的火火彩,AI 都能精准捕捉其物理特性。
  • 佩戴视角: 支持生成高精度的佩戴效果图,助力设计师快速验证产品在真实商业场景下的视觉表现。

首饰佩戴图展示


🛠️ 幕后功臣:技术架构与实现

VibeCanvas 的卓越表现源于其底层技术架构的深度打磨:

  • 核心驱动: 深度集成 Google Gemini 2.x/3.x 模型。我们不仅调用接口,更针对行业场景(如分镜切片、材质渲染)进行了精细的 Prompt 调优。
  • 高效后端: 采用 FastAPI 异步架构,确保在大规模图片处理与多线程 API 分发时的高响应速度。
  • 智能预处理: 自研 image_utils 工具集,支持动态缩放、无损切片及 Base64 自动转换。
  • 原生前端: 纯净前端技术栈确保了在大规模画布操作时的极低延迟,配合 CSS3 玻璃拟态设计,提供沉浸式操作体验。

📈 项目亮点总结

  1. 垂直行业赋能: 不做泛化的生成,而是深耕分镜、珠宝等对质量要求极高的细分领域。
  2. 多模态全链路: 实现从剧本解析到高精图像生成的完整闭环流转。
  3. 极简部署体验: 完美支持 Docker 容器化部署,环境变量配置即刻上线。

🔗 链接与社区


VibeCanvas 仍在不断进化中。如果您喜欢这个作品,欢迎在 GitHub 上点亮 🌟 Star,您的支持是我持续优化的最大动力!