PIXART-Σ是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员共同开发的一个基于Diffusion Transformer(DiT)的图像生成模型。
模型采用了一种独特的训练方法——从弱到强的训练方式——能够根据文本描述生成高质量的4K分辨率图像。这意味着,给定一段文字描述,PixArt-Σ能够创造出与描述相匹配的、非常高清晰度的图像。这对于需要高分辨率图像的领域,比如电影制作和游戏开发,是一个巨大的进步。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
巨量百应是抖音电商旗下的内容营销综合服务平台,百应平台以直播、短视频等激发消费者购物需求的内容场景为核心,为电商达人、机构、商家等生态伙伴打造兴趣电商领域前沿的产品解决方案。