首页 > Ai资讯 > Ai日报 > PicMenu：利用AI可视化你的菜单你只需拍一下菜单即可将你的菜名生成对应的图片

PicMenu：利用AI可视化你的菜单你只需拍一下菜单即可将你的菜名生成对应的图片

发布时间：2024年11月26日

78

PicMenu 是一个利用 AI 快速将餐厅菜单可视化的工具。通过拍摄菜单图片，PicMenu 可以为每道菜生成详细的图像和描述，提供更直观的餐饮信息。

主要功能

菜单解析与生成：
- 拍摄餐厅菜单的照片后，使用 AI 提取菜单项，生成每道菜的高质量图像。
AI 支持的详细信息：
- 提取并显示菜品的附加信息（未来可能包括成分、来源、卡路里和口味）。
多语言与标签支持（开发中）：
- 计划支持多语言菜单解析，并添加标签（如辣味、素食、纯素等），提供基于标签的过滤功能。

视频播放器

00:00

00:00

00:00

使用上/下箭头键来增高或降低音量。

技术架构

AI 模型：
- 使用 Together AI 的 Llama 3.2 Vision 90B 提取菜单信息。
- Llama 3.1 8B 用于生成结构化输出（JSON 格式）。
- Flux Schnell 模型用于生成高质量的菜品图像。
框架与工具：
- 基于 Next.js 和 TypeScript 构建。
- 使用 Tailwind CSS 和 Shadcn 设计用户界面。
- 集成 Plausible 和 Helicone 进行分析与监控。
文件存储：
- 使用 AWS S3 存储上传和生成的内容。

使用方法

克隆项目：git clone https://github.com/Nutlope/picmenu
配置环境变量：
- 创建 .env 文件并添加 Together AI API 密钥。
- 配置 AWS S3 存储的凭证。
安装依赖：运行 npm install 和 npm run dev 启动本地开发环境。

未来任务

提供更真实的菜品图像。
支持滚动加载和错误处理。
为不同语言的菜单提供示例支持。
增强过滤功能（如基于菜品标签筛选）。

适用场景

餐厅：快速将纸质菜单数字化并生成直观的菜品展示。
在线餐饮平台：为用户提供更丰富的菜品视觉信息。
多语言支持：适应国际化场景。

访问更多信息：PicMenu 官网或

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

如果你想要了解关于智能工具类的内容，可以查看智汇宝库，这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息，了解智能工具的用法以及最新动态。

SP-MangaEditor：一个完全免费的集成 AI 的网页漫画创作编辑工具 NVIDIA 发布一款音乐生成模型：Fugatto 可以对声音生成与转换进行精细化控制

最新工具