要点:PixArt-α是一款基于Transformer的文本到图像生成模型,具有竞争力的图像生成质量,且训练成本明显低于现有大规模文本到图像模型。PixArt-α采用了三项核心设计:训练策略分解,高效的T2I Transformer,以及使用..