Magi模型,由牛津大学工程科学系的视觉几何组开发。这项研究的核心目标是通过人工智能技术自动为漫画生成文字剧本,使得视觉障碍人士(PVI)也能够享受漫画的乐趣。
它可以全自动地为漫画页生成剧本,包括谁说了什么以及何时说的。通过识别漫画页面上的面板、文字块和角色,以及如何将它们相互关联。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
腾讯交互翻译TranSmart是由腾讯AI Lab发布的一款AI辅助翻译产品,可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量,支持大型文件的免费翻译。